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Applicant's or agent's file reference 
P12088 Dr.B 


IMPORTANT NOTIFICATION 


International application No. 
PCT/EP00/02064 


International filing date (day/month/year) 

09 March 2000 (09.03.00) 



1. The following indications appeared on record concerning: 

X the inventor | | the agent 



X the applicant 



| | the common representative 



Name and Address 



State of Nationality 



State of Residence 



Telephone No. 



Facsimile No. 



Teleprinter No. 



2. The International Bureau hereby notifies the applicant that the following change has been recorded conc erning: 
| | the person | | the name QjJ the address [ | the nationality Q^] the residence 



Name and Address 

SALLER, Robert, Michael 
Jutastrasse 22 
80636 Munchen 
Germany 



State of Nationality 
DE 



State of Residence 
DE 



Telephone No. 



Facsimile No. 



Teleprinter No. 



3. Further observations, if necessary: 

ADDITIONAL APPLICANT/INVENTOR FOR US ONLY. 



. s — 


4. A copy of this notification has been sent to: 




| X| the receiving Office 


| | the designated Offices concerned 


| | the International Searching Authority 


| X | the elected Offices concerned 


| X | the International Preliminary Examining Authority 


| | other: 


The International Bureau of WIPO 
34, chemin des Colombettes 
121 1 Geneva 20, Switzerland 


Authorized officer <^^^\ 
Peggy Steunenbera^ 


Facsimile No.: (41-22) 740.14.35 


Telephone No.: (41-22) 338.83.38 


Form PCT/IB/306 (March 1994) 


003664625 



Copy for the Elected Office (EO/US) 

P,^~ ZNT COOPERATION TREA 



PCT/EPOO/02064^ 



From the INTERNATIONAL BUREAU 



PCT 

NOTIFICATION OF THE RECORDING 
OF A CHANGE 

(PCT Rule 92bis.1 and 
Administrative Instructions, Section 422) 


To: 

BEHNISCH, Werner 
Reinhard-Skuhra-Weise & Partner GbR 

rrtcui luiioif assc o i 
Postfach 44 01 51 
D-80750 Munchen 

ALLbMAoNb 


Date of mailing (day/month/year) 
28 June 2001 (28.06.01) 


Applicant's or agent's file reference 
P12088 Dr.B 


IMPORTANT NOTIFICATION 


International application No. 
PCT/EP00/02064 


International filing date (day/month/year) 
09 March 2000 (09.03.00) - 



1. The following indications appeared on record concerning: 

X the applicant the inventor the agent | | the common representative 


Name and Address 

BAVARIAN NORDIC RESEARCH INSTITUTE 
A/S 

Vesterbrogade 149 
DK-1620 Copenhagen V 
Denmark 


State of Nationality 
DK 


State of Residence 
DK 


Telephone No. 


Facsimile No. 


Teleprinter No. 


2. The International Bureau hereby notifies the applicant that the following change has been recorded concerning: 

X the person | | the name | | the address | [ the nationality | | the residence 


Name and Address 

AUSTRIAN NORDIC BIOTHERAPEUTICS AG 
Veterinarplatz 1 
A-1 210 Vienna 
Austria 


State of Nationality 
AT 


State of Residence 
AT 


Telephone No. 


Facsimile No. 


Teleprinter No. 


3. Further observations, if necessary: 
Assignment. 


4. A copy of this notification has been sent to: 
| X| the receiving Office | | the designated Offices concerned 
| | the International Searching Authority | X| the elected Offices concerned 
| X| the International Preliminary Examining Authority | | other: 



The International Bureau of WIPO 


Authorized officer 


34, chemin des Colombettes 


Elisabeth KONIG 


1211 Geneva 20, Switzerland 




Facsimile No.: (41-22) 740.14.35 


Telephone No.: (41-22) 338.83.38 



Form PCT/IB/306 (March 1994) 004119235 



VERTRAG UBER DIE INTERNATIONALE ZUSAMMENARBEIT AUF DEM 
MGEBIET DES PATENTWESENS 



Absender: MIT DER INTERNATIONALEN VORLAUFIGEN 
PRUFUNG BEAUFTRAGTE BEHORDE 



An: 

BEHNISCH, Werner et al 

REINHARD, SKUHRA, WEISE & PARTNER 


CabH 

Postfach 44 01 51 
D-80750 Munchen 
ALLEMAGNE 


Eingegangen 

Reinhard * Skuhra • Weise 

- 6. Juni 2001 


ra, 09 ^. 


Erl. 



PCT 



MITTEILUNG UBER DIE UBERSENDUNG 
DES INTERNATIONALEN VORLAUFIGEN 
PRUFUNGSBERICHTS 

(Regel 71.1 PCT) 



Absendedatum 
(T ag/Monat/Jahr) 



05.06.2001 



Aktenzeichen des Anmelders Oder Anwalts 
P12088 Dr.B 


WICHTTGE MITTEILUNG 


Internationales Aktenzeichen 
PCT/E POO/02064 


Internationales Anmeldedatum (Tag/Monat/Jahr) 
09/03/2000 


Prioritatsdatum (Tag/Monat/Jahr) 
10/03/1999 


Anmelder 

GSF-FORSCHUNGSZENTRUM FUR UMWELT UND GESUNDHEIT... 





1. Dem Anmelder wird mitgeteilt, daB ihm die mit der internationalen vorlaufigen Prufung beauftragte Behorde 
hiermit den zu der internationalen Anmeldung erstellten internationalen vorlaufigen Prufungsbericht, 
gegebenenfails mit den dazugehorigen Anlagen, ubermittelt. 



2. Eine Kopie des Berichts wird - gegebenenfails mit den dazugehorigen Anlagen - dem Internationalen Buro zur 
Weiterleitung an alle ausgewahlten Amter ubermittelt. 



3. Auf Wunsch eines ausgewahlten Amts wird das Internationale Buro eine Obersetzung des Berichts (jedoch 
nicht der Anlagen) ins Englische anfertigen und diesem Amt ubermitteln. 



4. ERINNERUNG 

Zum Eintritt in die nationale Phase hat der Anmelder vor jedem ausgewahlten Amt innerhalb von 30 Monaten 
ab dem Prioritatsdatum (oder in manchen Amtern noch spater) bestimmte Handlungen (Einr;eichung von 
Obersetzungen und Entrichtung nationaler Gebuhren) vorzunehmen (Artikel 39 (1)) (siehe auch die durch das 
Internationale Buro im Formblatt PCT/IB/301 ubermittelte Information). 

1st einem ausgewahlten Amt eine Obersetzung der internationalen Anmeldung zu ubermitteln, so mu3 diese 
Obersetzung auch Obersetzungen aller Anlagen zum internationalen vorlaufigen Prufungsbericht enthalten. Es 
ist Aufgabe des Anmelders, solche Obersetzungen anzufertigen und den betroffenen ausgewahlten Amtern 
direkt zuzuleiten. 

Weitere Einzelheiten zu den maGgebenden Fristen und Erfordernissen der ausgewahlten Amter sind Band II 
des PCT-Leitfadens fur Anmelder zu entnehmen. 



Name und Postanschrift der mit der internationalen Prufung 
beauftragten Behorde 

Europaisches Patentamt 
D-80298 Munchen 

Tel. +49 89 2399 - 0 Tx: 523656 epmu d 
Fax: +49 89 2399 - 4465 



Bevollmachtigter Bediensteter 
Neumann, M 

Tel. +49 89 2399-7351 



Formblatt PCT/IPEA/416 (Juli 1992) 



(A 




PATENT COOPERATION TREATY 

PCT 

INTERNATIONAL PRELIMINARY EXAMINATION REPORT 

(PCT Article 36 and Rule 70) 



Applicant's or agent's file reference 
PI 2088 Dr.B 


SeeNotificationofTransmittaloflnternational Preliminary 
FOR FURTHER ACTION Examination Report (f orm PCT/IPEA/4 1 6) 


International application No. 

PCT/EP00/02064 


International filing date (day/month/year) 
09 March 2000 (09.03.00) 


Priority date (day/month/year) 

10 March 1999(10.03.99) 



International Patent Classification (IPC) or national classification and IPC 
C12N 15/867, 5/10, 7/01, A6 IK 48/00 



GSF-FORSCHUNGSZENTRUM FUR UMWELT UND GESUNDHEIT GMBH 



1. This international preliminary examination report has been prepared by this International Preliminary Examining Authority 
and is transmitted to the applicant according to Article 36. 


7 This REPORT consists of a total of 4 sheets, including this cover sheet. 




This report is also accompanied by ANNEXES, i.e., sheets of the description, claims and/or drawings which have been 
amended and are the basis for this report and/or sheets containing rectifications made before this Authority (see Rule 
70.16 and Section 607 of the Administrative Instructions under the PCT). 




These annexes consist of a total of 1 7 sheets. 


3. This report contains indications relating to the following items: 


I 




Basis of the report 


II 


□ 


Priority 


III 


□ 


Non-establishment of opinion with regard to novelty, inventive step and industrial applicability 


IV 


□ 


Lack of unity of invention 


V 


13 


Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 


VI 


13 


Certain documents cited 


VII 


□ 


Certain defects in the international application 


VIII 


13 


Certain observations on the international application 



Date of submission of the demand 

23 August 2000 (23.08.00) 


Date of completion of this report 

05 June 2001 (05.06.2001) 


Name and mailing address of the IPEA/EP 
Facsimile No. 


Authorized officer 
Telephone No. 



Form PCT/IPEA/409 (cover sheet) (July 1998) 



t 



INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



Tim 



International application No. 

PCT/EP00/02064 



I. Basis of the report 



1. With regard to the elements of the international application:* 
| | the international application as originally filed 
the description: 

pages 

pages 

pages 



1-19 



, as originally filed 
, filed with the demand 



, filed with the letter of 



the claims: 

pages 

pages 

pages 

pages 



, as originally filed 

, as amended (together with any statement under Article 19 

, filed with the demand 



1-20 



_ , filed with the letter of 



06 March 2001 (06.03.2001) 



the drawings: 

pages 

pages 

pages 



1/29-29/29 



, as originally filed 
, filed with the demand 



m , filed with the letter of 



the sequence listing part of the description: 

pages 

pages 

pages 



, as originally filed 

, , filed with the demand 



1-13 



. . filed with the letter of 26 January 2001 (26.01.2001) 



3. 



2. With regard to the language, all the elements marked above were available or furnished to this Authority in the language in which 
the international application was filed, unless otherwise indicated under this item. 

These elements were available or furnished to this Authority in the following language which is: 

| | the language of a translation furnished for the purposes of international search (under Rule 23.1(b)). 
| 1 the language of publication of the international application (under Rule 48.3(b)). 

| | the language of the translation furnished for the purposes of international preliminary examination (under Rule 55.2 and/ 
or 55.3). 

With regard to any nucleotide and/or amino acid sequence disclosed in the international application, the international 
preliminary examination was carried out on the basis of the sequence listing: 

I 1 contained in the international application in written form. 

| 1 filed together with the international application in computer readable form. 

furnished subsequently to this Authority in written form. 

furnished subsequently to this Authority in computer readable form. 

The statement that the subsequently furnished written sequence listing does not go beyond the disclosure in the 
international application as filed has been furnished. 

The statement that the information recorded in computer readable form is identical to the written sequence listing has 
been furnished. 



4. 



I | The amendments have resulted in the cancellation of: 

I I the description, pages 

[ 1 the claims, Nos. 

1 1 the drawings, sheets/fig 



5. 



□ This report has been established as if (some of) the amendments had not been made, since they have been considered to go 
beyond the disclosure as filed, as indicated in the Supplemental Box (Rule 70.2(c)).** 



* Replacement sheets which have been furnished to the receiving Office in response to an invitation under Article 14 are referred to 
in this report as "originally filed" and are not annexed to this report since they do not contain amendments (Rule 70.16 
and 70.17). 

** Any replacement sheet containing such amendments must be referred to under item 1 and annexed to this report. 



Form PCT/IPEA/409 (Box I) (July 1998) 



f 



INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



f 



ternational application No. 
PCT/EP 00/02064 



V. Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 



1 . Statement 

Novelty (N) 

Inventive step (IS) 
Industrial applicability (IA) 



Claims 
Claims 

Claims 
Claims 

Claims 
Claims 



1-20 



1-20 



1-11, 14, 15, 19, 20 



YES 
NO 
YES 
NO 

YES 



12, 13, 16-18: see Box VIII N q 



Citations and explanations 



The subject matter of the present claims appears to 
be novel and inventive, since the available prior 
art neither discloses nor suggests the incorporation 
of HERV sequences in retroviral vectors. The 
requirements of PCT Article 33(2) and (3) are 
therefore satisfied . 



Form PCT/IPEA/409 (Box V) (January 1994) 



INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



nternational application No. 

PCT/EP00/02064 



VI. Certain documents cited 



1 . Certain published documents (Rule 70. 1 0) 



Application No. 
Patent No. 



WO 00/23606 



Publication date 
(day/month/year) 



Filing date 
(day/month/year) 



Priority date (valid claim) 
(day/month/year) 



2. Non- written disclosures (Rule 70.9) 

Date of written disclosure 

Kind of non-written disclosure Date of non-written disclosure referring to non-written disclosure 

(day/month/year) (day/month/year) 



Form PCT7IPEA/409 (Box VI) (July 1998) 



INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



^piational application No. 
PCT/EP 00/02064 



\ II. Certain observations on the international application 

The following observations on the clarity of the claims, description, and drawings or on the question whether the claims are fully 
supported by the description, are made: 

Claims 12, 13 and 16-18 refer to subject matter 
which, in the opinion of this Authority, falls under 
PCT Rule 67.1(iv). Consequently, no report is 
established concerning the industrial applicability 
of the subject matter of said claims (PCT 
Article 34 (4) (a) (i) ) . 



Form PCT/IPEA/409 (Box VIII) (January 1994) 



VERTRAG UBER 



INTERNATIONALE ZUSA 
GEBIET DES PATENTWESE 



ENS 



ET..4 



NARBEIT AUF DEM 




PCT 

INTERNATIONALER VORLAUFIGER PRUFUNGSBERICHT 

(Artikel 36 und Regel 70 PCT) 



Aktenzeichen des A nm elders Oder Anwatts 
P12088 Dr.B 


siehe Mitteilung uber die Ubersendung des intemationalen 
WEITERES VORGEHEN vorlaufigen Prufungsberichts (Formblatt PCT/IPEA/416) 


Internationales Aktenzeichen 
PCT/E POO/02064 


Internationales Anmeldedatum (T ag/Monat/Jahr) 
09/03/2000 


Prioritatsdatu m (T ag/Monat/T ag) 
10/03/1999 


Internationale Patentklassifikation (IPK) Oder nationale Klassifikation und IPK 
C12N 15/867 


Anmelder 

GSF-FORSCHUNGSZENTRUM FUR UMWELT UND GESUNDHEIT... 



1 . Dieser Internationale vorlaufige Prufungsbericht wurde von der mit der intemationalen vorlaufigen Prufung beauftragten 
Behorde erstellt und wird dem Anmelder gemaB Artikel 36 ubermittelt. 

2. Dieser BERICHT umfaBt insgesamt Blatter einschlieBlich dieses Deckblatts. 

Kl AuBerdem liegen dem Bericht ANLAGEN bei; dabei handelt es sich urn Blatter mit Beschreibungen, Anspruchen 
und/oder Zeichnungen, die geandert wurden und diesem Bericht zugrunde liegen, und/oder Blatter mit vor dieser 
Behorde vorgenommenen Berichtigungen (siehe Regel 70.16 und Abschnitt 607 der Verwaltungsrichtlinien zum PCT). 

Diese Anlagen umfassen insgesamt 1 7 Blatter. 



3. Dieser Bericht enthalt Angaben zu folgenden Punkten: 



I 


IS 


Grundlage des Berichts 


II 


□ 


Prioritat 


III 


□ 


Keine Erstellung eines Gutachtens uber Neuheit, erfinderische Tatigkeit und gewerbliche Anwendbarkeit 


IV 


□ 


Mangelnde Einheitlichkeit der Erfindung 


V 




Begriindete Feststellung nach Artikel 35(2) hinsichtlich der Neuheit, der erfinderischen Tatigkeit und der 
gewerblichen Anwendbarkeit; Unterlagen und Erklarungen zur Stutzung dieser Feststellung 


VI 




Bestimmte angefuhrte Unterlagen 


VII 


□ 


Bestimmte Mangel der intemationalen Anmeldung 


VIII 




Bestimmte Bemerkungen zur intemationalen Anmeldung 



Datum der Einreichung des Antrags 
23/08/2000 


Datum der Fertigstellung dieses Berichts 
05.06.2001 


Name und Postanschrift der mit der intemationalen vorlaufigen 
Priifung beauftragten Behorde: 

Europaisches Patentamt 
^S) D-80298 Miinchen 

zdr 9 Tel. +49 89 2399 - 0 Tx: 523656 epmu d 
Fax: +49 89 2399 - 4465 


Bevollmachtigter Bediensteter 

SCHEFFZYK, I (f Ml jj 

Tel. Nr. +49 89 2399 8602 N -S2£^ 



Formblatt PCT/IPEA/409 (Deckblatt) (Januar 1994) 



INTERNATIONALER VORLAUFIGER 
PRUFUNGSBERICHT 



Internationales Aktenzeichen PCT/E POO/02064 



I.* Grundlage des Berichts 

1 . Hinsichtlich der Bestandteile der international Anmeldung (Ersatzblatter, die dem Anmeldeamt auf eine 
Aufforderung nach Artikel 14 hin vorgelegt wurden, gelten im Rahmen dieses Berichts als "ursprunglich 
eingereicht" und sind ihm nicht beigefugt, weil sie keine Anderungen enthaften (Regeln 70. 16 und 70. 17)): 
Beschreibung, Seiten: 

1 -1 9 ursprungliche Fassung 

Patentanspriiche, Nr.: 

1-20 eingegangen am 07/03/2001 mit Schreiben vom 06/03/2001 

Zeichnungen, Blatter: 

1/29-29/29 ursprungliche Fassung 

Sequenzprotokoll in der Beschreibung, Seiten: 

1-13, eingereicht mit Schreiben vom 2601 01 . 

2. Hinsichtlich der Sprache: Alle vorstehend genannten Bestandteile standen der Behorde in der Sprache, in der 
die internationale Anmeldung eingereicht worden ist, zur Verfugung oder wurden in dieser eingereicht, sofern 
unter diesem Punkt nichts anderes angegeben ist. 

Die Bestandteile standen der Behorde in der Sprache: zur Verfugung bzw. wurden in dieser Sprache 
eingereicht; dabei handelt es sich um 

□ die Sprache der Ubersetzung, die fur die Zwecke der internationalen Recherche eingereicht worden ist (nach 
Regel 23.1(b)). 

□ die Veroffentlichungssprache der internationalen Anmeldung (nach Regel 48.3(b)). 

□ die Sprache der Ubersetzung, die fur die Zwecke der internationalen vorlaufigen Prufung eingereicht worden 
ist (nach Regel 55.2 und/oder 55.3). 

3. Hinsichtlich der in der internationalen Anmeldung offenbarten Nucleotid- und/oder Aminosauresequenz ist die 
internationale vorlaufige Prufung auf der Grundlage des Sequenzprotokolls durchgefuhrt worden, das: 

□ in der internationalen Anmeldung in schriftlicher Form enthalten ist. 

□ zusammen mit der internationalen Anmeldung in computerlesbarer Form eingereicht worden ist. 
bei der Behorde nachtraglich in schriftlicher Form eingereicht worden ist. 

IS bei der Behorde nachtraglich in computerlesbarer Form eingereicht worden ist. 

K Die Erklarung, daB das nachtraglich eingereichte schriftliche Sequenzprotokoll nicht uber den 

Offenbarungsgehalt der internationalen Anmeldung im Anmeldezeitpunkt hinausgeht, wurde vorgelegt. 

E3 Die Erklarung, daB die in computerlesbarer Form erfassten Informationen dem schriftlichen 
Sequenzprotokoll entsprechen, wurde vorgelegt. 



Formblatt PCT/IPEA/409 (Felder l-VIII, Blatt 1) (Juli 1998) 



INTERNATIONALER VORLAUFIGER 

PRUFUNGSBERICHT Internationales Aktenzeichen PCT/E POO/02064 



4? Aufgrund der Anderungen sind folgende Unterlagen fortgefallen: 

□ Beschreibung, Seiten: 

□ Anspruche, Nr.: 

□ Zeichnungen, Blatt: 

5. □ Dieser Bericht ist ohne Beriicksichtigung (von einigen) der Anderungen erstellt worden, da diese aus den 
angegebenen Grunden nach Auffassung der Behorde uber den Offenbarungsgehalt in der ursprunglich 
eingereichten Fassung hinausgehen (Regel 70.2(c)). 

(Auf Ersatzblatter, die solche Anderungen enthalten, ist unter Punkt 1 hinzuweisen;sie sind diesem Bericht 
beizufugen). 



6. Etwaige zusatzliche Bemerkungen: 



V. Begrundete Feststellung nach Artikel 35(2) hinsichtlich der Neuheit, der erf inderischen Tatigkeit und der 
gewerblichen Anwendbarkeit; Unterlagen und Erklarungen zur Stiitzung dieser Feststellung 



1. Feststellung 
Neuheit (N) 

Erfinderische Tatigkeit (ET) 



Ja: Anspruche 1 -20 
Nein: Anspruche 

Ja: Anspruche 1 -20 
Nein: Anspruche 



Gewerbliche Anwendbarkeit (GA) Ja: Anspruche 1-11,14,15,19,20 

Nein: Anspruche 12,13,16-18: siehe Sektion VIII 



2. Unterlagen und Erklarungen 
siehe Beiblatt 



VI. Bestimmte angefuhrte Unterlagen 

1. Bestimmte veroffentlichte Unterlagen (Regel 70.10) 
und / oder 

2. Nicht-schriftliche Offenbarungen (Regel 70.9) 
siehe Beiblatt 

VIII. Bestimmte Bemerkungen zur internationalen Anmeldung 

Zur Klarheit der Patentanspruche, der Beschreibung und der Zeichnungen oder zu der Frage, ob die Anspruche 
in vollem Umfang durch die Beschreibung gestutzt werden, ist folgendes zu bemerken: 
siehe Beiblatt 



Formblatt Pr^^EA/409 (Felder l-VIII, Blatt 2) (Jul! 1998) 



INTERNATIONALER VORLAUFIGER Internationales Aktenzeichen PCT/E POO/02064 
PRUFUNGSBERICHT - BEIBLATT 



SEKTION V 

Der Gegenstand vorliegender Anspriiche scheint neu und erfinderisch zu sein, da 
der Einbau von HERV Sequenzen in retrovirale Vektoren in dem zur Verfugung 
stehenden Stand der Technik weder beschrieben noch vorgeschiagen wird. 
Demnach werden die Erfordernisse der Art. 33(2)(3) PCT erfullt. 

SEKTION VI 

WO 00/23606 

SEKTION VIII 

Die Anspruche 12,13,16-18 beziehen sich auf einen Gegenstand, der nach 
Auffassung dieser Behorde unter die Regel 67.1 (iv) PCT fallt. Daher wird uber die 
gewerbliche Anwendbarkeit des Gegenstands dieser Anspruche kein Gutachten 
erstellt (Artikel 34(4) a) (i) PCT). 



Formblatt PCT/Beiblatt/409 (Blatt 1) (EPA- April 1997) 



-03-2001 



EP 000002064 



20 



PCT/EP00/02064 



6. Marz2001 



Geanderte Patentanspruche 



l. 



Retroviraler Expressionsvektor, enthaltend zumindest die nachfolgenden Elemente in 



funktioneller Anordnung: 

a) DNA-Sequenzen zur Verpackung der Vektor-RNA und zur zellspezifischen Ex- 
pression von Proteinen oder Peptiden, die von heterologen DNA-Nukleo- 
tidsequenzen kodiert werden; 

b) ein oder mehrere fiir ein Protein oder Peptid kodierende DNA-Nukleotidse- 
quenzen, 

dadurch gekennzeichnet, 

daJ3 die DNA-Sequenzen zur zellspezifischen Expression eine zellspezifisch regu- 
lierbare Promotorregion aus einer humanen endogenen retroviralen DNA-Nukleotid- 
sequenz (HERV) enthalten. 

2. Expressionsvektor nach Anspruch 1, 
dadurch gekennzeichnet, 

daB die DNA-Sequenzen zur zellspezifischen Expression aus dem LTR-Bereich und 
wahlweise dem nicht translatierten Bereich zwischen der 5 1 LTR und dem gag-Bereich 
von HERVs stammen. 

2. Vektor nach Anspruch 1 oder Anspruch 2, 
dadurch gekennzeichnet, 

daB der gesamte LTR-Bereich, der U3 -Bereich oder der R- und U3-Bereich aus einer 
humanen endogenen retroviralen Nukleotidsequenz stammt. 

3. Vektor nach einem oder mehreren der vorhergehenden Anspriiche, 
dadurch gekennzeichnet, 



GEAENDERTES BLATT 



07-03-2001 



• 

21 



EP 000002064 



daB die fur ein oder mehrere Proteine oder Peptide kodierende Nukleotidsequenzen 
ausgewahlt werden aus einem oder mehreren Elementen der Gruppe, bestehend aus 
Markergenen, therapeutischen Genen, antiviralen Genen, Antitumorgenen und 
Zytokingenen. 

4. Vektor nach einem oder mehreren der vorhergehenden Anspriiche, 
dadurch gekennzeichnet, 

daB die zellspezifisch regulierbare Promotorregion aus dem LTR-Bereich einer zell- 
spezifisch exprimierten endogenen humanen retroviralen Nukleotidsequenz stammt. 

. 5. Vektor nach einem oder mehreren der vorhergehenden Anspriiche, 
dadurch gekennzeichnet, 

daB die humanen endogenen retroviralen zellspezifisch regulierbaren Promotorse- 
quenzen ausgewahlt werden aus einem oder mehreren Promotorsequenzen von 
HERV-Familien der Gruppe, bestehend aus HERV-K, HERV-H, HERV-E, HERV-L, 
HERV-T, HERV-R, HERV-I, HERV-P, ERV9. HERV-W. 

6. Vektor nach einem oder mehreren der vorhergehenden Anspriiche, 
dadurch gekennzeichnet, 

daB die Promotorregion neben der TATA-Box weitere Erkennungs- und Bindungs- 
stellen fiir regulatorische Proteine umfaBt. 

7. Vektor nach Anspruch 7, 
dadurch gekennzeichnet, 

daB die Erkennungs- und Bindungsstellen fur regulatorische Proteine die GC-Box, die 
CAAT-Box, Enhancersequenzen und Repressorsequenzen sowie Hormon-responsible 
Sequenzmotive umfassen und daB wahlweise zusatzlich Erkennungs- und 
Bindungsstellen ftir regulatorische Proteine aus der LTR-Region exogener Retroviren 
und/oder aus zellularen Genen enthalten sind. 

8. Vektor nach einem oder mehreren der vorhergehenden Anspriiche, 
dadurch gekennzeichnet, 
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daB der Vektor ein Promotor-Konversionsvektor ist, umfassend einen 5 f LTR-Ab- 
schnitt der Struktur U3-R-U5, ein oder mehrere Sequenzen, ausgewahlt aus kodie- 
renden und nicht kodierenden Sequenzen, und einen 3' LTR-Abschnitt, umfassend 
einen teilweise oder vollstandig deletierten U3-Abschnitt, wobei der deletierte U3- 
Abschnitt durctreine zellspezifisch regulierbare Promotorregion aus einer HERV- 
LTR-Sequenz ersetzt ist, gefolgt vom R-U5-Abschnitt. . 

9. mRNA oder RNA eines retroviralen Expressionsvektors nach einem oder mehreren 
der vorhergehenden Anspriiche. 

10. Prokaryontenzelle oder Eukaryontenzelle, enthaltend einen retroviralen Expres- 
sionsvektor nach einem oder mehreren der vorhergehenden Anspriiche. 

1 1 . Eukaryontenzelle, enthaltend einen retroviralen Expressionsvektor nach einem oder 
mehreren der vorhergehenden Anspriiche in integrierter Form. 

12. Verwendung eines zellspezifisch regulierbaren Promotorabschnitts aus einer humanen 
endogenen retroviralen DNA-Nukleotidsequenz zur Steuerung der Expression von 
Fremdgenen in retroviralen Expressionsvektoren, bevorzugt ProCon-Vektoren. 

13. Verwendung eines Expressionsvektors nach einem oder mehreren der vorhergehenden 
Anspriiche zur Expression von Fremdgenen in der Gentherapie. 

14. Virion, enthaltend eine retrovirale Expressionsvektor-RNA, die durch Transkription 
einer Expressionsvektor-DNA nach einem oder mehreren der vorhergehenden 
Anspriiche erhalten wurde. 

15. Verfahren zur Herstellung eines Virions nach Anspruch 14 zum Einfuhren einer oder 
mehreren fur ein Protein oder Peptid kodierender Nukleotidsequenzen, 

dadurch gekennzeichnet, 

daB der retrovirale Expressionsvektor nach einem oder mehreren der vorhergehenden 
Anspriiche in eine geeignete Verpackungszellinie unter solchen Bedingungen 
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eingebracht wird, daB das Virion ausgebildet wird und von der Verpakungszellinie 
freigesetzt wird. 

16. Verfahren zum Einfuhren von Nukleotidsequenzen, die fur ein oder mehrere Proteine 
oder Peptide kodieren, in eine Eukaryontenzelle, 
dadurch gekennzeichnet, 

daB die Zelle mit einem Virion nach Anspruch 14 unter solchen Bedingungen infiziert 
wird, daB die fur das Protein oder Peptid kodierende Nukleotidsequenzen in die chro- 
mosomale DNA der Eukaryontenzelle inseriert wird. 



17. Verfahren nach Anspruch 16, 
dadurch gekennzeichnet, 

daB die Eukaryontenzelle eine Saugerzelle ist. 

1 8 . Verfahren nach Anspruch 1 7, 
dadurch gekennzeichnet, 

daB die Saugerzelle eine menschliche Zelle ist. 



1 9. Retrovirales Vektorsystem, umfassend einen retroviralen Expressionsvektor nach 
einem oder mehreren der vorhergehenden Ansprilche und eine Verpackungszellinie 
mit zumindest einem retroviralen oder rekombinanten retroviralen Konstrukt, das fur 
die Verpackungsproteine des retroviralen Expressionsvektors kodiert. 

20. Retrovirales" Vektorsystem nach Anspruch 19, 
dadurch gekennzeichnet, 

daB die Verpackungszellinie retrovirale oder rekombinante retrovirale Konstrukte 
enthalt, die fur solche retroviralen Proteine kodieren, die vom retroviralen Expres- 
sionsvektor nicht kodiert werden. 
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SEQUENZPROTOKOLL 

<110> GSF - Forschungszentrum fiir Umwelt und Gesundheit 

<120> Retrovirale Expressions vektoren auf der Basis von 
HERV-LTR-Sequenzen . 

<130> P12088 

<140> PCT/EP00/02064 
<141> 2000-03-09 

<150> DE 199 10 650. 9 
<151> 1999-03-10 



<160> 47 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 375 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 1 

tgtcaggcct 

cagatagcct 

tgtttctgcc 

ctctttgtaa 

aagcattgcc 

ccacactttg 

ccatgttgct 



ctgagcccaa 
gaagcaactg 
ctaccctgac 
tcctccccac 
cctaactcca 
ctgactctct 
cacat 



gctaagccat 
taaaaatatc 
tgatcaatgt 
ccttgagaat 
ccgcctgtcc 
ttccagactc 



catatcccct 
cttaactgat 
gctttgtaat 
ggacttggtg 
caaaacctat 
agcccggctg 



gtgacctgca 
gacattccaa 
ctcccccacc 
agatccaccc 
gagaactaat 
cacccaggtg 



cgtatacatc 60 
tattgtgatt 120 
cttcagaagg 180 
cctgcctgca 24 0 
gataatccca 300 
aaataaacag 360 
375 



<210> 2 
<211> 400 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 2 

tgtcaggcct 

cagatggcct 

attccaacat 

ccccaccctt 

tccacacctg 

aatcctataa 

gcctgcaccc 



ctgagcccaa 
aaagtaactg 
tgtgatttgt 
aagaaggtcc 
cccaccagag 
aacggcccca 
aggtgaaata 



gccaggccat 
aagatccaca 
tcctgcccca 
tttgtaattc 
aacaaacccc 
ccccatctcc 
aacagccatg 



cgcatcccct 
aaagaagtaa 
ccctaactga 
tccccaccct 
ctttgactgt 
ctttgctgac 
ttgctcacat 



gtgacttgca 
aaacagcctt 
taaatgtact 
tgagagtgta 
aattttccat 
tctcttttcg 



cgtatacatc 60 
aactgatgac 120 
ttgtaatctc 180 
ctttgtgaga 240 
taccttccct 300 
gactcagccc 360 
400 



<210> 3 
<211> 361 
<212> DNA 

<213> Human endogenous retrovirus 
<400>.3 

tgtcaggcct ctgagcccaa gctaagccat catatcccct gcgacctgca catatacatc 60 
cagatggcct gaagtaactg aagaatcaca aaagaagtga aaatggcctg ttcctgcctt 120 
aactgatgac attaccttgt gaaattcctt ctcctggctc atcctggctc aaaagctccc 180 
gcactgagca ccttgtgacc cctgcctctg cccgccagag agcaaccccc tcttgactgt 240 
aattttcctt tacctaccta aatcctataa aatggcccca ctcctatctc ccttcgctga 300 
ctctcttttc ggactcagcc cgcctgtacc caggtgaaat aaacagccat gttgctcaca 360 
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<210> 4 
<211> 372 
*212> DNA 

<213> Human endogenous retrovirus 



<400> 4 

tgtcaggcct 

cagatggccg 

tgttcgtgcc 

tcaaaagctc 

cctttgactg 

cccttggctg 

tgttgctcac 



ctgagcccaa 
gttcctgcct 
ttaactgatg 
cccgactgag 
taattttcct 
actctctttt 
at 



gctaagccat 
taactgatga 
acattgtctt 
tacattgtga 
ttatctaccc 
cggactcagc 



catatcccct 
cattccacca 
gtgaaattcc 
cccccactcc 
aaatcctata 
ccgcctgcac 



gtgacctgca 
cgaaagaagt 
tcctcctggc 
tgcccgccag 
aaacagcccc 
ccaggtgaaa 



cgtacacatc 60 
gaaaatgacc 120 
tcatcctggc 180 
agaacagccc 240 
acctttatct 300 
taaacagcca 360 
372 



<210> 5 
<211> 349 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 5 

tgtcaggcct 

cagatggcct 

actgagtgat 

cttgtgaccc 

ctttcccaaa 

actcagcccg 



ctgagcccaa 
gaagtaactg 
taaccccatg 
ctgcccctgc 
tcctataaaa 
cctgcaccca 



gccaagccat 
aagaatcaca 
aatttccttc 
ccaccagaga 
cggccccacc 
ggtgaaataa 



cgcatcccct 
aaagaagtga 
ccctggctca 
acaaccccct 
cctatctccc 
acagccatgt 



gtgacttgca 
aaaggccctg 
gaagctcccc 
ttgactgtaa 
ttcgctgact 
tgctcacat 



cgt^tatgcc 60 
ccccacctta 120 
cactgagcac 180 
ttttccatta 240 
ctcttttcgg 300 
349 



<210> 6 
<211> 324 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 6 

tgtcaggcct ctgagcccaa gcctgcacgt atacatccag atgaagcaag tgaagaatca 60 
caaaagaagt gaaaatggcc ggttcctgcc ttaactgatg acattacctt. gtgaaattcc 120 
ttctcctggc tcagaagctc ccccactgag caccttgtga cccccactcc tccccgccac 180 
agaacaaccc cctttgactg taattttcca ctgcccgccc aaaccctata aaacggtccc 240 
accccatctc ccttccctga ctctcttttc ttcggactca gcccgcctgc acccaggtga 300 
aataaacagc catgttgctc acat 324 



<210> 7 
<211> 393 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 7 

tgtcaggcct ctgagcccaa gccaagccat cgcatcccct gtgacttgca cgtatacgcc 60 
cagatggcct gaagtaactg aagaatcaca aaagaactga aaaggccctg ccccgcctta 120 
actgatgaca ttccaccatg gtgatttgtt cttgccccac cttaactgag tgattaaccc 180 
tgtgaatttg cttctcctgg ctcagaagct cccccactga gcaccttgtg acccccgccc 240 
ctgcccacca gagaacaacc ccctttgact gtaattttcc attaccttcc caaatcctat 300 
aaaacggccc cacccctatc tcccttcgct gactctcttt tcggactcag cccgcctgcc 360 
cccaggtgaa ataaacagcc atgttgctca cat 393 

<210> 8 
<211> 393 
<212> DNA 

<213> Human endogenous retrovirus 
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<400> 8 

tgtcaggcct 

cagatggcct 

actgatgaca 

tgtgaatttg 

ctgcccacca 

aaaacggccc 

cccaggtgaa 



ctgagcccaa 
gaagtaactg 
ttccaccatg 
cttctcctgg 
gagaacagac 
cacccctatc 
ataaacagcc 



gccaagccat 
aagaatcaca 
gtgatttgtt 
ctcagaagct 
ccctttgact 
tcccttcgct 
atgttgctca 



cgcatcccct 
aaagaactga 
cttgccccac 
cccccactga 
gtaattttcc 
gactctcttt 
cat 



gtgacttgca 
aaaggccctg 
cttaactgag 
gcaccttgtg 
attaccttcc 
tcggactcag 



cgtatacgcc 60 
ccccgcctta 120 
tgattaaccc 180 
acccccgccc 240 
caaatcctat 300 
cccgcctgcc 360 
393 



<210> 9 
<211> 388 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 9 

tgtcaggcct 

cagatggcct 

attccaccat 

tcccaccctt 

tccaccccct 

actaatgata 

gtgaaataaa 



ctgagcccaa 
gaagcaactg 
tgtgatttgt 
aagaaggttc 
gccggcaaaa 
atccaccacc 
cagccatgtt 



gctaagccat 
aagatccaca 
ttctgcccca 
tttgtaattc 
cattgctcct 
ctttgctgac 
gctcacat 



catatcccca 
aaggaagtga 
tcctaactga 
tccccaccct 
aacccaaccg 
tcttttcaga 



gggacctgca 
aaatagcctt 
tcaatgtact 
tgagagtgta 
cctaccccaa 
atcagcccgc 



cgtatacatc 60 
aactgatgac 120 
ttgtaatctc 180 
ctttgtgaga 240 
acctgtaaga 300 
ctgcacccag 360 
' 388 



<210> 10 
<211> 314 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 10 

tgtcaggcct ctgagcccaa gctaagccat caaatcccct gtgacctgca cgtgtacatc 60 
cagatgacct gaagcaactg aagatccaca aaagaagtga aagtagcctt aactgatgac 120 
attccaccat tgtgatttgt tcctgcccca cgctaactga taccatatat tcttcccccg 180 
cccttgagaa tgtactttgt acacctatcc caaacctata agaactaatg ataatcctac 240 
caccctttgc tgactctctt tttggactca gcccgcctgc acccaggtga aataaacagc 300 
catgttgctc acat 314 



<210> 11 
<211> 309 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 11 

tgtcaggcct ctgagcccaa gctaagccat catatcccgt gacctgcata tacatccaga 60 
tggcctgaag caactgaaga tccacaaagg aagtgaaaat agccttaact gatgacattc 120 
caccattgtg atttgttcct gccccacgct aactgatacc atatattctt cccccgccct 180 
tgagaatgta ctttgtacac ctatcccaaa cctataagaa ctaatgataa tccaccaccc 240 
tttgctgact ctctttttgg actcagcccg cctgcaccca ggtgaaataa acagccatgt 300 
tgctcacat 309 



<210> 12 
<211> 314 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 12 

tgtcaggcct ctgagcccaa gctaagccat caaatcccct gtgacctaca cgtgtacatc 60 
cagatgacct gaagcaactg aagatccaca aaagaagtga aagtagcctt aactgatgac 120 
attccaccat tgtgatttgt tcctgcccta cgctagctga taccatatat tcttcccccg 180 
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cccttgagaa tgtactttgt acacctatcc caaacctata agaactaatg ataatcctac 240 
caccctttgc tgactctctt tttggactca gcccgcctgc acccaggtga aataaacagc 300 
catgttgctc acat 314 



<210> 13 
<211> 341 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 13 

tgttgagatg ggggactgag agacaggact agctggattt cctaggccga ctaagaatcc 60 
ctaagcctag ctgggaaggt gaccgcatcc acctttaaac acggggctcg caacttagct 120 
cacacccaac caatcaggta gtaaagaggg ctcactaaaa tgctaattag gcaaagacag 180 
gaggtaaaga aatagccaat catctattgc ctgagagcac agcaggaggg acaatgatcg 240 
ggatataaac ccaagtcttc gagccggcaa tggctacctt ctttgggtcc cctccctttg 300 
tatgggagct ctgttttcac tctattaaat cttgcaactg c 341 

<210> 14 
<211> 341 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 14 

tgttgagatg ggggactgag agacaggact agctggattt cctaggccga ctaagaattc 60 
ctaagcctag ctgggaaggt gaccgcatcc atctttaaac atggggcttg caacttaact 120 
catatctgac caatcaggta gtaaagagag ctcactaaaa tgctaattag gctaaaacag 180 
gaggcaaaga agtagccaat catctgttgc ctgacagcac agcaggaggg acaatgatcg 240 
ggatataaac ccaggcattc gagccagcta cagctaccct ctttgggtcc cctccctttg 300 
tatgggagct ctgtcttcac tctattaaat cttgcaactg c 341 

<210> 15 
<211> 322 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 15 

tgttgagatg ggggactgag agacaggact acctggattt cctaggccga ctaagaatcc 60 
ctaagcctag ctgggaaggt gaccacatcc acctttaaac acagggcttg caacttagct 120 
cacacttgac cagtcaggta gtaaagagag ctcactaaaa tgctaattag gctaaaacag 180 
gaggtaaaga aatagacaat catctatcac ctgagagcac agtgggaggg acaatgatcg 240 
gcatataaac ccaggcattc gagccagcaa cagcaacccc ctttgggagc tctgttttca 300 
ctctattaaa tcttgcaact gc 322 



<210> 16 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 16 

tgttgagatg 

ctaagcctag 

cacacccaac 

gaggtaaaga 

ggatataaac 

tatgggagct 



ggggactgag agacaggact agctggattt cctaggccaa ctaagaatcc 60 
ctgggaaggt gactacaccc acctttaaac atggggcttg caacttagct 120 
caatcaggta gtaaagagag cttgctaaaa tgctaattag gcaaaaacag 180 
aatagccagt catctatcgc ctgacagcac aaggggcggg acaatgatca 240 
tcaggcattc aagccagcaa tggctaccca ctttgggtcc cctcccattt 300 
ctgttttcac tctattaaat cttgcaactg caa 343 



<210> 17 
<211> 343 
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<212> DNA 

<213> Human endogenous retrovirus 



<400> 17 

tgttgagatg 

ctaagcctag 

catacccaac 

gaggtaagga 

ggatataaac 

tatgggagct 



ggggactgag agacaggact agctggattc cctaggccga ctaagaatcc 60 
ctgggaaggt gaccacatcc acctttaaac acggggcttg caacttagct 120 
aaatcaggta gtaaagagag ctcactaaaa tactgattag gcgaaaacag 180 
aacagccagt catctatcgc ctgacagcac aaggggcggg acaatgatca 240 
tcaggcattc aagccagcaa tggctaccca ctttgggtcc cctcccattt 300 
ctgttttcac tctattaaat cttgcaactg caa 343 



<210> 18 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 18 

tgttgagatg 

ctaagcctag 

cacacccgac 

gaggtaaaga 

ggatataaac 

tatgggagcc 



ggggactgag 
ctgggaaatt 
caatcaggta 
agtagccaat 
ccaggcattc 
ctgttttcac 



agacaggact 
gaccacgtcc 
gtaaagggag 
catctatcgc 
aagccagcgg 
tctattaaat 



agttggattt 
acctttaaac 
ctcactaaaa 
ctgagagcac 
tggctaccct 
cttgcaactg 



cctaggctgg ctaagaatcc 60 
acggggcttg caatttagct 120 
tgctaattag ggaaaaacag 180 
aacaggaggg acaatgatca 240 
ctttgggtcc cctccctttg 300 
caa " 343 



<210> 19 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 19 

tgttgagatg 

ctaagcctag 

cacacccgac 

gaggtaaaga 

ggatataaac 

tatggaagct 



ggggactgag agacaggact agttggattt cctaggccgg ctaagaatcc 60 

ctgggaaatt gaccacgtcc acctttaaac acggggcttg caatttagct 120 

caatcaggta gtaaagggag ctcactaaaa tgctaattag ggaaaaacag 180 

agtagccaat catctatcgc ctgagagcac aacaggaggg acaatgatca 240 

ccaggcattc aagccagcgg tggctaccct ctttgggtcc cctccctttg 300 

ctgttttcac tctattaaat cttgcaactg caa 343 



<210> 20 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 20 

tgttgagatg 

ctaagcctag 

cacacccgac 

gaggtagaga 

ggatataaac 

tatgggagct 



ggggactgag agacaggact agctggattt cctaggccaa ctaagaatcc 60 
ctgggaaggt gactacaccc acctttaacc actaggcttg caacttagct 120 
caatcaggta gtaaagagag cttgctaaaa tgctaattag gcaaaaacag 180 
aatagccaat catctatcgc ctgagagcac agcaggaggg acaatgatcc 240 
ccaagcattc gagccagcaa tggctaccct ctttgtgtcc cctccctttg 300 
ctattttcac tctattaaat cttgcaactg caa 343 



<210> 21 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 21 

tgttgagatg ggggactgag agacaggact agctggattt cctaggctga ctaagaatcc 60 
ctaagcctag ctgggaaggt gaccgcatcc atctttaaac atggggcttg caacttaact 120 
catatctgac caatcaggta gtaaagagag cttgctaaaa tgctaattag gcaaaaacag 180 
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gaggtaaaga aatagccagt catctatcgc ctgacagcac aaggggcggg acaatgatca 24 0 
ggatataaac tcaggcattc aagccagcaa tggctaccca ctttgggtcc cctcccattt 300 
tatgggagct ctgttttcac tctattaaat cttgcaactg caa 343 



<210> 22 
<211>.343 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 22 

tgttgagatg 

ctaagcctag 

cacacccgac 

gaggtaaaga 

ggatataaac 

tatgggagct 



ggggactgag 
ctgggaaggt 
caatcaggta 
aatagccagt 
tcaggcattc 
ctgttttcac 



agacaggact 
gactacaccc 
gtaaagagag 
catctatcgc 
aagccagcaa 
tctattaaat 



agctggattt 
acctttaacc 
cttgctaaaa 
ctgacagcac 
tggctaccca 
cttgcaactg 



cctaggctga 
actaggcttg 
tgctaattag 
aaggggcggg 
ctttgggtcc 
caa 



ctaagaatcc 60 
caacttagct 120 
gcaaaaacag 180 
acaatgatca 24 0 
cctcccattt 300 
343 



<210> 23 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 23 

tgttgagatg 

ctaagcctag 

cacacccgac 

gaggtaaaga 

ggatataaac 

tatggaagct 



ggggactgag 
ctgggaaatt 
caatcaggta 
agtagccaat 
ccaggcattc 
ctgttttcac 



agacaggact 
gaccacgtcc 
gtaaagggag 
catctatcgc 
aagccagcgg 
tctattaaat 



agttggattt 
acctttaaac 
ctcactaaaa 
ctgagagcac 
tggctaccct 
cttgcaactg 



cctaggctgg ctaagaatcc 60 
acggggcttg caatttagct 120 
tgctaattag ggaaaaacag 180 
aacaggaggg acaatgatca 240 
ctttgggtcc cctccctttg 300 
caa 343 



<210> 24 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 24 

tgttgagatg 

ctaagcctag 

cacacccgac 

gaggtaaaga 

ggatataaac 

tatgggagct 



ggggactgag agacaggact acctggattt cctaggccaa ctaagaatct 60 
ctgggaaggt gaccacatcc acctttaaac acagggcttg caacttagct 120 
ccatcaggta agaaagagag cccgctaaaa tgctaattag gcaaaaacag 180 
aatagtcaat catctattgc ctgagagcac agcgggaggg acaatgatca 240 
ccaggcattc gagccggcaa cgactaccct ctttgggtcc cctccctttg 300 
ctgttttcac tctattaaat cttgcaactg caa 343 



<210> 25 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 25 

tgttgagatg ggggactgag agacaggact agctggattt cctaggccaa ctaagaatcc 60 
ctaagcctag ctgggaaggt gactacaccc acctttaacc actaggcttg caacttagct 120 
cacacccgac caatcaggta gtaaagagag cttgctaaaa tgctaattag gcaaaaacag 180 
gaggtaaaga aatagccagt catctatcgc ctgacagcac aaggggcggg acaatgatca 240 
ggatataaac tcaggcattc aagccagcaa tggctaccca ctttgggtcc cctcccattt 300 
tatgggagct ctgttttcac tctattaaat cttgcaactg caa 343 



<210> 26 
<211> 343 
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<212> DNA 

<213> Human endogenous retrovirus 



.<400> 26 

tgttgagatg 

ctaagcctag 

cacacccgac 

gaggtaaaga 

ggatataaac 

tatgggagct 



ggggactgag aaacaggact agcaggattt cctaggccga ttaagaatcc 60 

atgggaagtt gaccacatcc acctttaaac acggggcttg caactcagct 120 

ccatcaggta agaaagagag cccgctaaaa tgctaattag gcaaaaacag 180 

aatagccaat catctattgc ctgagagcac agcgggaggg acaatgatca 240 

ccaggcattc gagccggcaa cgactaccct ctttgggtcc cctccctttg 300 
ctgttttcac tctattaaat cttgcaactg caa 343 



<210> 27 
<211> 619 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 27 

gcgaccggtg 

cgggttttat 

ttgtctcaac 

ttacgggtgt 

actatcacat 

gccttccgca 

gagcatgctg 

tcaaccctga 

gattaacaga 

atgtctactt 

tttccccctt 



gatcccgggc 
accgagacat 
tgcaagaggc 
cgggctgggg 
ggggagaaac 
gtttttgtgt 
ccttcaagca 
gttgacacag 
atctcaaggc 
ctttctacac 
ttcttttcg 



ccgcggtacc 
tccattgccc 
attccttcct 
gacggtcagg 
cttggacaat 
cctgggtact 
tctgtttaac 
cacacgtttc 
agaagaattt 
agacacagta 



gtcgactgca 
agggacaggc 
cttatactaa 
tctttccctt 
acctggcttt 
tgagattagg 
aaagcacatc 
agagagcacg 
ttcttaacac 
acaatctgat 



gaattcatgg 
aggagacaga 
tcctcctcag 
cccacgaggc 
cctaggcaga 
gagtggtgat 
ctgcaccgcc 
gggttggggg 
ataacaaaat 
ctctcttgct 



agcatacaat 
tgccttcctc 
cacagaccct 
catatttcag 
ggtccctgcg 
gactcttaag 
cttaatccat 
taaggtcata 
ggagtctccc 
tttccccaca 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

619 



<210> 28 
<211> 620 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 28 

gcgaccggtg 

cgggttttat 

ttgtctcaac 

ttacgggtgt 

actatcacat 

gccttccgca 

gagcatgctg 

tcaaccctga 

gattaacaga 

atgtctactt 

tttccccctt 



gatcccgggc 
accgagacat 
tgcaagaggc 
cgggctgggg 
ggggagaaac 
gtttttgtgt 
ccttcaagca 
gttgacacag 
atctcaaggc 
ctttctacac 
ttcttttcga 



ccgcggtacc 
tccattgccc 
attccttcct 
gacggtcagg 
cttggacaat 
cctgggtact 
tctgtttaac 
cacacgtttc 
agaagaattt 
agacacagta 



gtcgactgca 
agggacaggc 
cttatactaa 
tctttccctt 
acctggcttt 
tgagattagg 
aaagcacatc 
agagagcacg 
ttcttaacac 
acaatctgat 



gaattcatgg 
aggagacaga 
tcctcctcag 
cccacgaggc 
cctaggcaga 
gagtggtgat 
ctgcaccgcc 
gggttggggg 
ataacaaaat 
ctctcttgct 



agcatacaat 
tgccttcctc 
cacagaccct 
catatttcag 
ggtccctgcg 
gactcttaag 
cttaatccat 
taaggtcata 
ggagtctccc 
tttccccaca 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

620 



<210> 29 
<211> 624 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 29 

gcgaccggtg 

cgggttttat 

ttgtctcaac 

ttacgggtgt 

actatcacat 

gccttccgca 

gagcatgctg 



gatcccgggc 
accgagacat 
tgcaagaggc 
cgggctgggg 
gggaagaaac 
gtttttgtgt 
ccttcaagca 



ccgcggrtacc 
tccattgccc 
attccttcct 
gatggtcagg 
cttggacaat 
cctgggtact 
tctgtttaac 



gtcgactgca 
agggacaggc 
cttatactaa 
tctttccctt 
acctggcttt 
tgagattagg 
aaagcacatc 



gaattcatgg 
aggagacaga 
tcctcctcag 
cccacgaggc 
cctaggcaga 
gagtggtgat 
ctgcactgcc 



agcatacaat 60 
tgccttcctc 120 
cacagaccct 180 
catatttcag 240 
ggtccctgcg 300 
gactcttaag 360 
cttaatccat 420 
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tcaaccctga gttgacacag cgcacgtttc agagagcacg gggttggggg taaggtcata 480 
gattaacaga atctcaaggc agaagaattt ttcttaacac ataacaaaat ggagtctccc 540 
atgtctactt ctttctacac agacacagta acaatctgat ctctcttgct tttccccaca 600 
tttccccctt ttcttttcga caaa 624 



<210> 30 
<211> 646 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 30 

gcgaccggtg 

cgggttttat 

ttgtctcaac 

ttacgggtgt 

actatcacat 

gccttccgca 

gagcatgctg 

tcaaccctga 

gattaacaga 

atgtctactt 

tttccccctt 



gatcccgggc 
accgagacat 
tgcaagaggc 
cgggctgggg 
ggggagaaac 
gtttttgtgt 
ccttcaagca 
gttgacacag 
atctcaaggc 
ctttctacac 
ttcttttcga 



ccgcggtacc 
tccattgccc 
attccttcct 
gacggtcagg 
cttggacaat 
cctgggtact 
tctgtttaac 
cacacgtttc 
agaagaattt 
agacacagta 
caaaaccgcc 



gtcgactgca 
agggacaggc 
cttatactaa 
tctttccctt 
acctggcttt 
tgagattagg 
aaagcacatc 
agagagcacg 
ttcttaacac 
acaatctgat 
atctcgagat 



gaattcatgg 
aggagacaga 
tcctcctcag 
cccacgaggc 
cctaggcaga 
gagtggtgat 
ctgcaccgcc 
gggttggggg 
ataacaaaat 
ctctcttgct 
ctgagt 



agcatacaat 
tgccttcctc 
cacagaccct 
catatttcag 
ggtccctgcg 
gactcttaag 
cttaatccat 
taaggtcata 
ggagtctccc 
tttccccaca 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

64 6 



<210> 31 
<211> 672 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 31 

gtcccacctc 

gttttatacc 

tctcaactgc 

cgggtgtcgg 

atcacatggg 

ttccgcagtt 

catgctgcct 

accctgagtt 

taacagaatc 

tctacttctt 

cccccttttc 

cgccctatag 



cagccctaag 
gagacattcc 
aagaggcatt 
gctgggggac 
gagaaacctt 
tttgtgtcct 
tcaagcatct 
gacacagcac 
tcaaggcaga 
tctacacaga 
ttatccatca 
tg 



gcggtttttc 
attgcccagg 
ccttcctctt 
ggtcaggtct 
ggacaatacc 
gggtacttga 
gtttaacaag 
acgtttcaga 
agaatttttc 
cacagtaaca 
cactggcggc 



cctatctcag 
gacaggcagg 
atactaatcc 
ttcccttccc 
tggctttcct 
gattagggag 
gcacatcctg 
gagcacgggg 
ttaacacata 
atctgatccc 
cgctcgagca 



tagatggagc 
agacagatgc 
tcctcagcac 
acgaggccat 
aggcagaggt 
tggtgatgac 
caccgccctt 
ttgggggtaa 
acaaaatgga 
tcttgctttt 
tgcatctaga 



atacaatcgg 
cttcctcttg 
agacccttta 
atttcagact 
ccctgcggcc 
tcttaaggag 
aatccattca 
ggtcatagat 
gtctcccatg 
ccccacattt 
gggcccaatt 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
• 660 
672 



<210> 32 
<211> 593 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 32 

agtagatgga 

ggagacagat 

cctcctcagc 

ccacgaggcc 

ctaggcagag 

gagtggtgat 

ctgcaccgcc 

gggttggggg 

ataacaaaat 

ctctcttgct 



gcatacaatc 
gccttcctct 
acagaccctt 
atatttcaga 
gtccctgcgg 
gactcttaag 
cttaatccat 
taaggtcata 
ggagtctcct 
tttccccaca 



gggttttata 
tgtctcaact 
tacaggtgtc 
ctatcacatg 
ccttctgcag 
gagcatgctg 
tcaaccctga 
gattaacaga 
atgtctactt 
tttccccctt 



ccgagacatt 
gcaagaggca 
gggctggggg 
gggagaaacc 
tttttgtgtc 
ccttcaagca 
gttgacacag 
atctcaaggc 
ctttctacac 
ttcttttcga 



ccattgccca 
ttccttcctc 
acggtcaggt 
ttggacaata 
cctgggtact 
tctgtttaac 
cacatgtttc 
agaagaattt 
agacacagta 
caaaaccgcc 



gggacaggca 
ttttactaat 
ctttcccttc 
cctggctttc 
tgagattagg 
aaagcacatc 
agagagcacg 
ttcttagcac 
acaatttgat 
ate 



60 

120 

180 

240 

300 

360 

420 

480 

540 

593 
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<210> 33 
<211> 943 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 33 ■ 
tgtgggcgaa 
ataatataga 
catggacatt 
ttgttttatt 
acattgtgag 
cagcttgagg 
gcagaccatg 
agcttcttgt 
tgctgtgctt 
cctctttga'a 
tataagtgca 
taaaaggaaa 
gaggactcac 
agccattcgg 
tgttttctct 
catggggaga 



ggattaccca 
aaatagctag 
accaatcatt 
actaatataa 
aagtgaccta 
gctccttggt 
aaagggagtc 
gtatccagcc 
caatggccat 
gttcgtagaa 
tagaagaaaa 
ggcccccttt 
cctccttacc 
ggccactact 
ttatctcttt 
acaccggcaa 



ggtgccgagg 
aataagaata 
actacaaaca 
ccaaggaata 
gaaggcaaga 
caagctgtaa 
tccattcctt 
ctgcccacag 
gcttcttgtc 
gataatggta 
cactgatgta 
cccatgatca 
ctgtcccttt 
ggtctccgca 
tgtcttgtgt 
agcccgtagg 



caagagactg 
gttataataa 
ttgttaatca 
accggtagca 
ggtgagcctt 
caccagtgcc 
ggaggagtca 
tcatccagag 
cactttcatg 
gaagaaatag 
tgcctgcctt 
catgacttgc 
gtcttgtatg 
acttggtggt 
ctttatttct 
gctggacctt 



aaggcacaaa 
aaattagata 
ttagctttta 
tacggtcagg 
ctgtcacgcc 
tgggaaggca 
gggaaacact 
gcataaaccc 
ttcctcctgt 
tgaaagtctt 
ccctctctgc 
ctgaccttat 
caataaatat 
agtggtaccc 
tacaatctct 
aca 



ctgtttcagt 
tacacatgat 
a tattactct 
tgctgaaggg 
tgcataagga 
ccgttactta 
atgctccacc 
ctccctgtgg 
actcctggtt 
tgatctttct 
ttcagctacc 
caatcacttg 
cagcacgccc 
tgggcccagc 
catctctgca 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

943 



<210> 34 
<211> 389 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 34 

aaacccctcc ctgtggtgct gtgcttcaat ggccatgctt cttgtccact ttcatgttcc 60 
tcctgtactc ctggttcctc tttgaagttc gtagaagata atggtagaag aaatagtgaa 120 
agtctttgat ctttcttata agtgcataga agaaaacact gatgtatgcc tgccttccct 180 
ctctgcttca gctacctaaa aggaaaggcc ccctttccca tgatcacatg acttgcctga 240 
ccttatcaat cacttggagg actcaccctc cttaccctgt ccctttgtct tgtatgcaat 300 
aaatatcagc acgcccagcc attcggggcc actactggtc tccgcaactt ggtggtagtg 360 
gtaccctggg cccagctgtt ttctcttta 389 

<210> 35 
<211> 858 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 35 

tgtgggcgga agagtaccta ggtgccgagg caagagactg aaggcacaaa ctgtttcagt 60 
ataataaaga aaatagaata agaatagtca taatacaaat tagatacagc gatgatcatg 120 
aacaattatc catcattatt ataaacatta ttaatcatta gcttttaata ttactctgtt 180 
gcattaataa tataacctag gaataaccgg caggtatagg gtcaggtgct gaagggacat 240 
tgtgagaagt gaatagaagg caagagggga gccttctgtc atgcccgcat aagggccgct 300 
tgagggcccc ttggtcaagc ggtaacgcca gtgtctggga aggcacccgt tactgagcag 360 
accgggaaag ggagtctcct ttccttggag gagtcaggga acgctctgct ccaccagctt 420 
cttgtgggag gctggatgtt acccaggcct gcctgcagtc atccggaggc ctgaacccct 480 
ccctgtggtg cttcaatggt cacgttcctt gtccactttc atgctccttc cgtactcctg 540 
gttcctcttt gaagttcgta gtagatagcg gtagaagaaa tagtgaaagt cttaaagtct 600 
ttgatcttat aagttcatag aagaaaacgc tgatgcctgc cgccttctct ctctgcttca 660 
gctacctaag agggaagggc ccgctgtcct gtgatcaggt gacttgcttc accttgtcaa 720 
tcacttagaa gactgaccct ccttatcctg cccccttgtc ttgtatgcaa taaatatcag 780 
cgagcccagc cgttcagggc cactaccggt ctccgtgtct ttgtggtagt ggtccccggg 840 
cccagctgtt ttctcttt 858 



<210> 36 
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<211> 386 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 36 

gaacccctcc ctgtggtgct tcaatggtca cgttccttgt ccactttcat gctccttccg 60 
tactcctggt tcctctttga agttcgtagt agatagcggt agaagaaata gtgaaagtct 120 
taaagtcttt gatcttataa gttcatagaa gaaaacgctg atgcctgccg ccttctctct 180 
ctgcttcagc tacctaagag ggaagggccc gctgtcctgt gatcaggtga cttgcttcac 240 
cttgtcaatc acttagaaga ctgaccctcc ttatcctgcc cccttgtctt gtatgcaata 300 
aatatcagcg agcccagccg ttcagggcca ctaccggtct ccgtgtcttt gtggtagtgg 360 
tccccgggcc cagctgtttt ctcttt 386 



<210> 37 
<211> 844 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 37 

tgtgggtgga ggattaccca ggtgccaagg caagagactg aaggcacaaa ctgtttcagt 60 
ataataaaaa aaatagaata agaatagtca taatacaaat tagatataga gatgatcatg 120 
gacaattagc aatcactatt aatctttagc ttttaatatt actctttgtt gcattactaa 180 
tataacctag gaataaccgg tgggtatagg gtcaggtgct gaagggacat tgtg^tgaagt 240 
gacctggaag gcaagaggtg agccctctgt cacgcccaca taagggccgc ttgagggctc 300 
cttggtcaag tggtaacgcc agtgtctggg aatgcacccg ttaattagca gaccgcgaaa 360 
gggagtctcc tttccttgga agagttgggg aacactctgc tccaccagct tcttgtggaa 420 
ggctggatat tatccaggcc tgcgcgcagt catccggagg cttaaaccct tccctgtggt 480 
gctgtgcttc aatggtccca ctccttgtcc actttcatgc tcctcccgta ctcctggttc 540 
ctctttgaag agcgcagtag atagcggtag aagaaatagt gaaagtctta aagtcttcga 600 
tctttcttac aagtgcagag aagaaaacgc tgacatatgc tgccttccct ctctgcttcg 660 
gctacctaaa agggaagggc cgcctatcct gtaatcacat gacttgcttc accttgtcaa 720 
tcacttagaa gattcactct ccttaccctg cccccttgtc ttgtatgcaa taaatatcag 780 
tgaccccagc cgttcagggc cactactggt ctccgcgtct tgatggtagt ggtcaccccg 840 
gccc 844 



<210> 38 
<211> 381 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 38 

aaacccttcc ctgtggtgct gtgcttcaat ggtcccactc cttgtccact ttcatgctcc 60 
tcccgtactc ctggttcctc tttgaagagc gcagtagata gcggtagaag aaatagtgaa 120 
agtcttaaag tcttcgatct ttcttacaag tgcagagaag. aaaacgctga catatgctgc 180 
cttccctctc tgcttcggct acctaaaagg gaagggccgc ctatcctgta atcacatgac 24 0 
ttgcttcacc ttgtcaatca cttagaagat tcactctcct taccctgccc ccttgtcttg 300 
tatgcaataa atatcagtga ccccagccgt tcagggccac tactggtctc cgcgtcttga 360 
tggtagtggt caccccggcc c 381 



<210> 39 
<211>859 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 39 

tgtgggtgga ggattaccca ggtgccaagg caagagactg aaggcacaaa ctgtttcagt 60 
ataataaaaa aaatagaata agaatagtca taatacaaat tagatataga gatgatcatg 120 
gacaattagc aatcactatt aatctttagc ttttaatatt actctttgtt gcattactaa 180 
tataacctag gaataaccgg tgggtatagg gtcaggtgct gaagggacat tgtgagaagt 240 
gacctggaag gcaagaggtg agccctctgt cacgcccaca taagggccgc ttgagggctc 300 
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cttggtcaag tggtaacgcc 
gggagtctcc tttccttgga 
ggctggatat tatccaggcc 
SCtgtgcttc aatggtccca 
ctctttgaag agcgcagtag 
tctttcttac aagtgcagag 
gctacctaaa agggaagggc 
tcacttagaa gattcaccct 
tgaccccagc cgttcagggc 
gcccaggtgt tttttcttt 



agtgtctggg aatgcacccg 
agagttgggg aacactctgc 
tgcgcgcagt catccggagg 
ctccttgtcc actttcatgc 
atagcggtag aagaaatagt 
aagaaaacgc tgacatatgc 
cgcctatcct gtaatcacat 
ccttaccctg cccccttgtc 
cactactggt ctccgcgtct 



ttaattagca gaccgcgaaa 360 
tccaccagct tcttgtggaa 420 
cttaaaccct tccctgtggt 480 
tcctcccgta ctcctggttc 540 
gaaagtctta aagtcttcga 600 
tgccttccct ctctgcttcg 660 
gacttgcttc accttgtcaa 720 
ttgtatgcaa taaatatcag 780 
tgatggtagt ggtcaccccg 84 0 

859 



<210> 40 
<211> 396 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 40 

aaacccttcc 

tcccgtactc 

agtcttaaag 

cttccctctc 

ttgcttcacc 

tatgcaataa 

tggtagtggt 



ctgtggtgct 
ctggttcctc 
tcttcgatct 
tgcttcggct 
ttgtcaatca 
atatcagtga 
caccccggcc 



gtgcttcaat 
tttgaagagc 
ttcttacaag 
acctaaaagg 
cttagaagat 
ccccagccgt 
caggtgtttt 



ggtcccactc 
gcagtagata 
tgcagagaag 
gaagggccgc 
tcaccctcct 
tcagggccac 
ttcttt 



cttgtccact 
gcggtagaag 
aaaacgctga 
ctatcctgta 
taccctgccc 
tactggtctc 



ttcatgctcc 60 
aaatagtgaa 120 
catatgctgc 180 
atcacatgac 240 
ccttgtcttg 300 
cgcg'tcttga 3 60 
396 



<210> 41 
<211> 966 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 41 

tgtgggtgga 

ataataaaga 

catggacaat 

tttgttgcat 

ggacattggg 

ggttgcttga 

ttagccgacc 

ccagcttctt 

aacccctccc 

cccatactcc 

atcttaaagt 

ttctctgtct 

tgcttcacct 

atgcaataaa 

tggtagtggt 

attacaatct 

cctaca 



ggattaccca 
aaatggttag 
tatcaatcat 
tactaatata 
agaagtgacc 
gggctccttg 
acgaaaggga 
gtggaaggct 
tgtggtgctg 
tggtttctct 
gtttgatctt 
gcttcagcta 
tgtcaatcac 
tatcagtgca 
cccccgggcc 
ctcgtctccg 



ggtgccgagg 
aataagaata 
tattataaac 
acctaggaat 
tagaaggcaa 
gtcaagtggt 
gtctcctttc 
ggatattatc 
tgcttcaatg 
ttgaagttcg 
tcttataagt 
cctaagaggg 
ttagaagatt 
cccagccttt 
cagctgtttt 
cacacaggga 



caagagactg 
gtcataatac 
attattaatc 
aaccggtggg 
gaggtgagtc 
aacgccggtg 
cttggaggag 
caggcctgcc 
ggcacactcc 
tagtagatag 
gcatagaaga 
aagggccccc 
caccctcctt 
cggggccact 
ctctttatct 
gaacacccgc 



aaggcacaaa 
aaattagata 
attagctttt 
tatagggtca 
ttctgtcacg 
tctgggaagg 
tcagggcgca 
cgcagtcatc 
tcgtccactt 
tggtagaagg 
aaacgctgac 
tgtccagtga 
accctgcccc 
taccggtctc 
ctttgtcttg 
taagctccgt 



ctgtttcagt 
tagagatgat 
aatattactc 
ggtgctgaaa 
cccgcataag 
cacctgttac 
ctctgctcca 
cggaggccta 
tcatgttcct 
aatagggaaa 
atatgctgcc 
tcacgtgact 
cttgtcttgt 
cacgtcttgg 
tgtcttattt 
agggctggac 



60 

120 

180. 

240 

300 

360 

420 

480 

540 

600 . 

660 

720 

780 

840 

900 

960 

966 



<210> 42 
<211> 398 
<212> DNA - 

<213> Human endogenous retrovirus 



<400> 42 . 

aaacccctcc ctgtggtgct 
tcccatactc ctggtttctc 
aatcttaaag tgtttgatct 
cttctctgtc tgcttcagct 
ttgcttcacc ttgtcaatca 



gtgcttcaat gggcacactc ctcgtccact ttcatgttcc- 60 
tttgaagttc gtagtagata gtggtagaag gaatagggaa 120 
ttcttataag tgcatagaag aaaacgctga catatgctgc 180 
acctaagagg gaagggcccc ctgtccagtg atcacgtgac 240 
cttagaagat tcaccctcct taccctgccc ccttgtcttg 300 
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tatgcaataa atatcagtgc acccagcctt tcggggccac ttaccggtct ccacgtcttg 360 
gtggtagtgg tcccccgggc ccagctgttt tctcttta 398 



<210> 43 
<211> 938 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 43 

tgtgggtgga 

ataataaaga 

catggacaat 

tttgttgcat 

ggacattggg 

ggttgcttga 

ttagccgacc 

ccagcttctt 

aacccctccc 

cccatactcc 

atcttaaagt 

ttctctgtct 

tgcttcacct 

atgcaataaa 

ggtagtggtc 

tacaatctct 



ggattaccca 
aaatggttag 
tatcaatcat 
tactaatata 
agaagtgacc 
gggctccttg 
acgaaaggga 
gtggaaggct 
tgtggtgctg 
tggttcctct 
gtttgatctt 
gcttcagcta 
tgtcaatcac 
tatcagtgca 
ccccggccca 
cgtctccgca 



ggtgccgagg 
aataagaata 
tattataaac 
acctaggaat 
tagaaggcaa 
gtcaagtggt 
gtctcctttc 
ggatattatc 
tgcttcaatg 
ttgaagttcg 
tcttataagt 
cctaagaggg 
ttagaagatt 
cccagccttt 
gctgttttct 
cacagggaga 



caagagactg 
gtcataatac 
attattaatc 
aaccggtggg 
gaggtgagtc 
aacgccggtg 
cttggaggag 
caggcctgcc 
ggcacactcc 
tagtagatag 
gcatagaaga 
aagggccccc 
caccctcctt 
cggkkcactt 
ctttatctct 
acacccgc 



aaggcacaaa 
aaattagata 
attagctttt 
tatagggtca 
ttctgtcacg 
tctgggaagg 
tcagggcaca 
cgcagtcatc 
tcgtccactt 
tggtagaagg 
aaacgctgac 
tgtccagtga 
accctgcccc 
accggtctcc 
ttgtcttgtg 



ctgtttcagt 
tagagatgat 
aatattactc 
ggtgctgaag 
cccgcataag 
cacctgttac 
ctctgctcca 
cggaggccta 
tcatgttcct 
aatagggaaa 
atatgctgcc 
tcacgtgact 
cttgtcttgt 
acgtcttggt 
tcttatttat 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

938 



<210> 44 
<211> 396 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 44 

aaacccctcc 

tcccatactc 

aatcttaaag 

cttctctgtc 

ttgcttcacc 

tatgcaataa 

tggtagtggt 



ctgtggtgct 
ctggttcctc 
tgtttgatct 
tgcttcagct 
ttgtcaatca 
atatcagtgc 
cccccggccc 



gtgcttcaat 
tttgaagttc 
ttcttataag 
acctaagagg 
cttagaagat 
acccagcctt 
agctgttttc 



gggcacactc 
gtagtagata 
tgcatagaag 
gaagggcccc 
tcaccctcct 
tcggkkcact 
tcttta 



ctcgtccact 
gtggtagaag 
aaaacgctga 
ctgtccagtg 
taccctgccc 
taccggtctc 



ttcatgttcc 60 
gaatagggaa 120 
catatgctgc 180 
atcacgtgac 240 
ccttgtcttg 300 
cacgtcttgg 360 
396 



<210> 45 
<211> 963 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 45 

tgtgggcgaa agattaccta ggtgccgagg caagagactg aaggcacaaa ctgtttcagt 60 

.ataataaaga aaatagttaa aataagaata gttataatac aaattagata tagagatgat 120 

catggacaat tatcaatcat tattataaac attaatcatt agcttttaat attactcttt 180 

gttgctttac taatataacc taggaataac cggtgggtat agggtcaggt gttgacggga 240 

tattgtgaga agtgacctag aaggcaagag gtgagccttc tgtcacgccc acataagggc 300 

cgcttgaggg ctctttggtc aagtggtaac gccagtgtct gtgaaggcac ctgttactta 360 

gcagaccgcg aaagggagtc tcctttcctt ggaggagtca gggaacactc tgctccacca 420 

gcttcttgtg gaaggctgga tattatctag gcctgcccgc agtcatctgg aggcctaaac 480 

ccctccctgt ggtgctgtgc ttcagtggtc actctccttg tccactttca tgttcctccc 540 

gtactcctgg ttcctctttg aagttcgtag tagatagcag tagaagaaat agtgaaagtc 600 

ttaaagtatt tgatctttct tataagtgca tagaagaaaa cgctgacata tgctgccttc 660 

tctatctctg cggtggctac ctaaaaggga agggccccct gtcccatgat catgtgactt 720 

gcttcacctt atcacttaga agattcatcc tccttaccct gcgccccctc gtcttgtatg 780 

caataaatat cagcacgccc agtcgtttga ggccactgcc ggtctccgcg tcttggtggt 840 
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agtggtcccc cgggcccagc tattgtctct ttatctcttt gtcttgtgtc tttatttatt 900 
acaatctctt gtctctgcac acagggagaa cacctgctaa gccccgtagg actggaccct 960 



aca 



963 



<210> 46 
<211> 397 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 46 

aaacccctcc ctgtggtgct gtgcttcagt ggtcactctc cttgtccact ttcatgttcc 60 
tcccgtactc ctggttcctc tttgaagttc gtagtagata gcagtagaag aaatagtgaa 120 
agtcttaaag tatttgatct ttcttataag tgcatagaag aaaacgctga catatgctgc 180 
cttctctatc tctgcggtgg ctacctaaaa gggaagggcc ccctgtccca tgatcatgtg 240 
acttgcttca ccttatcact tagaagattc atcctcctta ccctgcgccc cctcgtcttg 300 
tatgcaataa atatcagcac gcccagtcgt ttgaggccac tgccggtctc cgcgtcttgg 360 
tggtagtggt cccccgggcc cagctattgt ctcttta 397 



<210> 47 
<211> 489 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 47 

tgttcaattc tttgccttct acttttaaac ttaacttcct cataaagcaa cctttttcaa 60 
tcacctgctc cactctgact cattctgatc acctgctcca ccctgactca ttccgatcac 120 
ctgatccact gtgactcatt ccgattaccc "gctccaccct gactcattct gattctgatt 180 
tcctgctctg ccataaccat ttttcccgcc aaaccactca ccctgtcact ctctttaaat 240 
tagccaattg gaattagttt agcctgtgcg gtctaaccct agccaatagg ggactgacac 300 
agcagcaggg gccacatgtg tcaggaataa gacccccttc ccctccctgt ccagatgtgt 360 
gctcaccatt gctccatctg tgagggcaca cccttctata gaagtaaatt gccttgctga 420 
gaagaaaaaa aagaacattt tatattcaag tcctatttct tttgctgcac cgaaacttta 480 
tttataaca AQa 



GEAENDERTES BLATT 




CLAIMS 

1. Retroviral expression vector containing at least the 
following elements in functional assembly: 

a) DNA sequences for packaging of the vector RNA and for 
cell-specific expression of proteins or peptides encoded 
by heterologous DNA nucleotide sequences; 

b) one or more DNA nucleotide sequences encoding a 
protein or peptide 

wherein said DNA sequences for the cell-specific 
expression contain a cell-specifically controllable 
promoter region from a human endogenous retroviral DNA 
nucleotide sequence (HERV) . 

2 . Expression vector according to claim 1 wherein said DNA 
sequences for cell-specific expression are derived from 
the LTR region and optionally from the non- translated 
region between the 5' LTR and the gag region of HERVs . 

3 . Vector according to claim 1 or claim 2 wherein the whole 
LTR region, the U3 region, or the R and U3 regions are 
derived from a human endogenous retroviral nucleotide 
sequence . 

4. Vector according to one or more of the preceding claims 
wherein said nucleotide sequences encoding one or more 
proteins or peptides are selected from one or more 
elements of the group consisting of marker genes, 
therapeutic genes, antiviral genes, anti- tumor genes, 
and cytokin genes . 



5. 



Vector according to one or more of the preceding claims 
wherein said cell-specifically controllable promoter 




region is derived from the LTR region of a cell- 
specifically expressed endogenous human retroviral 
nucleotide sequence . 

6. Vector according to one or more of the preceding claims 
wherein said human endogenous retroviral cell- 
specifically controllable promoter sequences are 
selected from one or more promoter sequences of HERV 
families of the group consisting of HERV-K, HERV-H, 
HERV-E, HERV-L, HERV-T, HERV-R, HERV- I, HERV-P, ERV9 , 
HERV-W. 

7 . Vector according to one or more of the preceding claims 
wherein said promoter region besides the TATA box 
additionally comprises recognition and binding sites for 
regulatory proteins. 

8. Vector according to claim 7 wherein said recognition and 
binding sites for regulatory proteins comprise the GC 
box, the CAAT box, enhancer sequences and repressor 
sequences as well as hormone responsive sequence motifs 
and wherein, optionally, additional recognition and 
binding sites for regulatory proteins from the LTR 
region of exogenous retroviruses and/or from cellular 
genes are comprised. 

9 . Vector according to one or more of the preceding claims 
wherein said vector is a promoter conversion vector 
comprising a 5' LTR portion having the structure U3-R- 
U5, one or more sequences selected from coding and non- 
coding sequences, and a 3' LTR portion comprising a U3 
region which is partially or completely deleted wherein 
the deleted U3 portion is replaced by a cell- 




specifically controllable promoter region from a HERV 
LTR sequence, followed by the R-U5 region. 

10. The mRNA or RNA of a retroviral expression vector 
according to one or more of the preceding claims. 

11. Prokaryotic cell or eukaryotic cell containing a 
retroviral expression vector according to one or more of 
the preceding claims. 

12. Eukaryotic cell containing a retroviral expression 
vector according to one or more of the preceding claims 
in an integrated form. 

13. Use of a cell-specifically controllable promoter region 
from a human endogenous retroviral DNA nucleotide 
sequence for the regulation of the expression of foreign 
genes in retroviral expression vectors, preferably in 
ProCon vectors . 

14. Use of an expression vector according to one or more of 
the preceding claims for the expression of foreign genes 
in gene therapy. 

15. Virion containing a retroviral expression vector RNA 
derived from an expression vector DNA according to one 
or more of the preceding claims. 

<. 

16. Method for the preparation of a virion according to 
claim 15 for the introduction of one or more nucleotide 
sequences encoding a protein or peptide wherein said 
retroviral expression vector according to one or more of 
the preceding claims is introduced into a suitable 




packaging cell line under such conditions that the 
virion is formed and released by the packaging cell 
line . 

17 . Method for the introduction of nucleotide sequences 
encoding one or more proteins or peptides into an 
eukaryotic cell wherein said cell is infected by a 
virion according to claim 15 under such conditions that 
the nucleotide sequences encoding the protein or peptide 
is inserted into the chromosomal DNA of the eukaryotic 
cell. 

18. Method according to claim 17, wherein the eukaryotic 
cell is a mammalian cell. 

19. Process according to claim 18, wherein the mammalian 
cell is a human cell. 

20. Retroviral vector system comprising a retroviral 
expression vector according to one or more of the 
preceding claims and a packaging cell line comprising 
at least one retroviral or recombinant retroviral 
construct encoding for the packaging proteins of the 
retroviral expression vector. 

21. Retroviral vector system according to claim 20, wherein 
the packaging cell line comprises retroviral or 
recombinant retroviral constructs encoding for such 
retroviral proteins which are not encoded by the 
retroviral expression vector. 
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Aktenzeichen des Anmelders Oder Anwalts 

P 12088 Dr.B 


WEITERES siene Mitteilung uber die Ubermittlung des intemationalen 

Recherchenberichts (Formblatt PCT/ISA/220) sowie, soweit 
VORGEHEN zutreffend, nachstehender Punkt 5 


Internationales Aktenzeichen 

PCT/EP 00/02064 


Internationales Anmeldedatum 
(T ag/Monat/Jahr) 

09/03/2000 


(Fruhestes) Prioritatsdatum (Tag/Monat/Jahr) 

10/03/1999 


Anmelder 

GSF-FORSCHUNGSZENTRUM FUR UMWELT UND GESUNDHEIT. . . 



Dieser internationale Recherchenbericht wurde von der Intemationalen Recherchenbehdrde erstellt und wird dem Anmelder gemaB 
Artikel 18 ubermittelt. Eine Kopie wird dem Intemationalen Buro ubermittelt 



. Blatter. 



Dieser Internationale Recherchenbericht umfaBt insgesamt 4 

PH Daruber hinaus liegt ihm jeweils eine Kopie der in diesem Bericht genannten Unterlagen zum Stand der Technik bei. 



1 . Grundlage des Berlchts 

a. Hinsichtlich der Sprache ist die internationale Recherche auf der Grundlage der intemationalen Anmeldung in der Sprache 
durchgefuhrt worden, in der sie eingereicht wurde, sofern unter diesem Punkt nichts anderes angegeben ist. 

I I Die internationale Recherche ist auf der Grundlage einer bei der Behorde eingereichten Ubersetzung der intemationalen 
Anmeldung (Regel 23.1 b)) durchgefuhrt worden. 

b. Hinsichtlich der in der intemationalen Anmeldung offenbarten Nucleotide und/oder Amlnosauresequenz ist die internationale 
Recherche auf der Grundlage des Sequenzprotokolls durchgefuhrt worden, das 

|X| in der intemationalen Anmeldung in Schriflicher Form enthalten ist 

pT| zusammen mrt der intemationalen Anmeldung in computerlesbarer Form eingereicht worden ist. 

| | bei der Behorde nachtraglich in schriftlicher Form eingereicht worden ist. 

| | bei der Behorde nachtraglich in computerlesbarer Form eingereicht worden ist. 

I I Die Erklarung, daB das nachtraglich eingereichte schriftliche Sequenzprotokoll nicht uber den Offenbarungsgehalt der 
intemationalen Anmeldung im Anmeldezeitpunkt hinausgeht, wurde vorgelegt. 

I I Die Erklarung, daB die in computerlesbarer Form erfaBten Informationen dem schriftlichen Sequenzprotokoll entsprechen, 
wurde vorgelegt. 

2. [X] Bestlmmte AnsprOche haben slch als nlcht recherchlerbar erwlesen (siehe Feld I). 
3 Ul Mangelnde Elnhertllchkert der Erflndung (siehe Feld II). 



4. Hinsichtlich der Bezelchnung der Erflndung 

[X| wird der vom Anmelder eingereichte Wortlaut genehmigt. 
| | wurde der Wortlaut von der Behorde wie folgt festgesetzt: 



Hinsichtlich der Zusammenfassung 

[Y] wird der vom Anmelder eingereichte Wortlaut genehmigt. 

— wurde der Wortlaut nach Regel 38.2b) in der in Feld III angegebenen Fassung von der Behorde festgesetzt. Der 

I | Anmelder kann der Behorde innerhalb eines Monats nach dem Datum der Absendung dieses intemationalen 

Recherchenberichts eine Stellungnahme vorlegen. 

Folgende Abbildung der Zelchnungen ist mit der Zusammenfassung zu verdffentlichen: Abb. Nr. - 



I | wie vom Anmelder vorgeschlagen Q keine der Abb. 

I | weil der Anmelder selbst keine Abbildung vorgeschlagen hat. 
| | weil diese Abbildung die Erfindung besser kennzeichnet. 



Formblatt PCT/ISA/210 (Biatt 1) (Juli 1998) 




Internationales Aktenzeichen PCT£ P 00 X)2064 



WEITERE ANGABEN 



PCT/ISA/ 210 



Fortsetzung von Feld 1.1 

Obwohl sich Anspruch 13 und die Anspruche 16 - 18, soweit sie sich auf 
eine in vivo Anwendung beziehen, auf ein Verfahren zur Behandlung des 
menschlichen/tierischen Korpers beziehen, wurde die Recherche 
durchgefuhrt und grundete sich auf die angeftihrten Wirkungen der 
Verbindung/Zusammensetzung. 



INTERNATIONALER RECHERCHENBERICHT 



Intt^Btipnalea Aktenzetchen 

4PEP 00/02064 



A. KLASSIFIZERUNG DES ANMELDUNGSGEGENSTANDES 

IPK 7 C12N15/867 C12N5/10 C12N7/01 A61K48/00 



Nach der International en PatentMassifikation (IPK) oder nach der nationaien Klassifikation und der IPK 



B. RECHERCHIERTE GEBIETE 



Recherchierter Mindestprufstoff (Klassifikationssystem und Klassifikationssymboie ) 

IPK 7 C12N A61K 



Recherchierte aber nicht zum Mindestprufstoff g eh 6 rend e Veroffentlichungen, soweit diese unter die recherchierten Gebiete fallen 



Wahrend der intemationaJen Recherche konsultierte elektronische Datenbank (Name der Datenbank und evtt. verwendete Suchbegriffe) 

BIOSIS 



C. ALS WESENTUCH ANGESEHENE UNTER LAG EN 



Kategorie 0 Bezeichnung der Veroffentlichung, soweit erforderiich unter Angabe der in Betracht kommenden Teile 



Betr. Anspruch Nr. 



SCHOEN U. ET AL: "Tissue specific 
expression and promoter activity of 
different HERV - LTRs . " 
JOURNAL OF MOLECULAR MEDICINE, 
Bd. 75, Nr. 7, 1997, Seite B228 
XP000946480 
Zusammenf assung 

WO 96 28563 A (BAVARIAN NORDIC ;GSF 
FORSCHUNGSZENTRUM UMWELT (DE); GUENZBURG 
WALT) 19. September 1996 (1996-09-19) 
das ganze Dokument 

-/-- 



1-20 



1-20 



Weitere Veroffentlichungen sind der Fortsetzung von Feld C zu 
entnehmen 



Siehe Anhang Patentfamilie 



° Besondere Kategorien von angegebenen Veroffentlichungen 
"A" Veroffentlichung, die den allgemeinen Stand der Technik definiert, 
aber nicht als besonders bedeutsam anzusehen ist 

"E" alteres Dokument, das jedoch erst am Oder nach dem intemationalen 
Anmeldedatum veroffentlicht worden ist 

"L" Veroffentlichung, die geeignet ist, einen Priori tatsanspruch zweifelhaft er- 
scheinen zu I ass en, oder durch die das Veroffentlichungsdatum einer 
anderen im R ec here henbe rich t genannten Veroffentlichung belegt werden 
soli oder die a us einem anderen besonderen Grund angegeben ist (wie 
ausgefuhrt) 

"O" Veroffentlichung, die sich auf eine mundliche Offenbarung, 

eine Benutzung, eine Ausstellung oder andere MaBnahmen bezieht 

"P" Veroffentlichung, die vor dem intemationalen Anmeldedatum, aber nach 
dem beanspruchten Prioritatsdatum veroffentlicht worden ist 



' Spatere Veroffentlichung, die nach dem intemationalen Anmeldedatum 
oder dem Prioritatsdatum veroffentlicht worden ist und mit der 
Anmeldung nicht kollidiert, sondem nur zum Verstandnis des der 
Erfindung zugrundeliegenden Prinzips oder der ihr zugrundeliegenden 
Theorie angegeben ist 

" Veroffentlichung von besonderer Bedeutung; die beanspruchte Erfindung 
kann allein aufgrund dieser Veroffentlichung nicht als neu oder auf 
erfinderischer Tatigkeit beruhend betrachtet werden 

" Veroffentlichung von besonderer Bedeutung; die beanspruchte Erfindung 
kann nicht als auf erfinderischer Tatigkeit beruhend betrachtet 
werden, wenn die Veroffentlichung mit etner oder mehreren anderen 
Veroffentlichungen dieser Kategorie in Verbindung gebracht wird und 
diese Verbindung fur einen Fachmann naheliegend ist 

■ Veroffentlichung, die Mitglied derselben Patentfamilie ist 



Datum des Abschlusses der intemationalen Recherche 



22. September 2000 



Absendedatum des intemationalen Recherchenberichts 



10/10/2000 



Name und Postanschrift der IntemationaJen Recherchenbehorde 

Europaisches Patentamt, P,B. 5818 Patentlaan 2 
NL - 2280 HV Rijswijk 
Tel. (+31-70) 340-2040, Tx. 31 651 epo nl, 
Fax: (+31-70) 340-3016 



Bevollmachtigter Bediensteter 



Mandl, B 
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INTERNATIONALER RECHERCHENBERICHT 



lonales Aktenzefchen 

P 00/02064 



C(Fbrtsetrung) ALS WESENTUCH ANGESEHENE UNTERLAGEN 



Kategorie* Bezeichnung der Veroffentlichung, soweit erforderiich unter Angabe der in Betracht kommenden Teite 



Betr. Anspruch Nr. 



SJOTTEM E ET AL: "The promoter activity 
of long terminal repeats of the HERV -H 
family of human retrovirus-1 ike elements 
is critically dependent on Spl family 
proteins interacting with a GC/GT box 
located immediately 3' to the TATA box." 
JOURNAL OF VIROLOGY, 
Bd. 70, Nr. 1, Januar 1996 (1996-01), 
Seiten 188-198, XP002148194 
das ganze Dokument 

ANDERSSEN S. ET AL.: "Comparative 
analyses of LTRs of the ERV-H family of 
primate-specific retrovirus-1 ike elements 
isolated from marmoset, African green 
monkey, and man. " 
VIROLOGY, 

Bd. 234, Nr. 1, 1997, Seiten 14-30, 
XP002132290 
ISSN: 0042-6822 
das ganze Dokument 

WO 00 23606 A (MEDICAL COLLEGE OF GEORGIA 
INS) 27. April 2000 (2000-04-27) 
das ganze Dokument 



1-20 



1-20 



1-6, 
10-20 



Formbtatt PCT7ISA/210 (Fortsotzung von Blatt 2) (Juli 1992) 
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INTERNATIONAL SEARCH REPORT 

Info^H^i on patent family members 



Jonal Application No 



P 00/02064 



Patent document 
cited in search report 


Publication 
date 


Patent family 
member(s) 


Publication 
date 


WO 9628563 A 


19-09-1996 


AU 


5103996 


A 


02-10-1996 






EP 


0817858 


A 


14-01-1998 






JP 


11503305 


T 


26-03-1999 



W0 0023606 A 27-04-2000 AU 1128400 A 08-05-2000 



Form PCT/1SA/210 (patent family annex) (July 19S2) 



fj^^fcprnationafes Aktenzeichen 
INTERNATIOrSRfi RECHERCHENBERICHT PC T/EP 00/02064 



Feld I Bemerkungen zu den Anspruchen, die sich als nicht recherchierbar erwiesen haben (Fortsetzung von Punkt 2 auf Blatt 1 



) 



Gemaft Artikei 17(2)a) wurde aus folgenden Grunden fur bestimmte Anspruche kein Recherche nbericht ersteltt: 



□ 



Anspruche Nr. 

weil sie sich auf Gegenstande beziehen, zu deren Recherche die Behorde nicht verpfiichtet ist, namlich 

siehe Zusatzblatt WEITERE ANGABEN PCT/ISA/210 



Anspruche Nr. 

weil sie sich auf Teile der intemationalen Anmeldung beziehen, die den vorgeschriebenen Anforderungen so wenig entsprechen, 
daft eine sinnvolle internationale Recherche nicht durchgefuhrt werden kann, namlich 



3. | | Anspruche Nr. 

weil es sich dabei um abhangige Anspruche handelt, die nicht entsprechend Satz 2 und 3 der Regel 6.4 a) abgefaBt sind. 



Feld II Bemerkungen bei mangelnder Einheitlichkeit der Erfindung (Fortsetzung von Punkt 3 auf Blatt 1) 



Die internationale Recherchenbehorde hat festgestellt, dafi diese internationale Anmeldung mehrere Erfindungen enthalt: 



1. 



I I Da der Anmelder alle erforderiichen zusatzlichen Recherchengebuhren rechtzeitig errtrichtet hat, erstreckt sich dieser 
1 1 internationale Recherchenbericht auf alle recherchierbaren Anspruche. 



2. I I Da fur alle recherchierbaren Anspruche die Recherche ohne einen Arbeitsaufwand durchgefuhrt werden konnte, der eine 
1 1 zusatzliche Recherchengebuhr gerechtfertigt hatte, hat die Behorde nicht zur Zahlung einer solchen Gebuhr aufgefordert. 



3. Da der Anmelder nur einige der erforderiichen zusatzlichen Recherchengebuhren rechtzeitig entrichtet hat, erstreckt sich dieser 

1 1 internationale Recherchenbericht nur auf die Anspruche, fur die Gebuhren entrichtet worden sind, namlich auf die 

Anspruche Nr. 



1 1 Der Anmelder hat die erfordertidien zusatzlichen Recherchengebuhren nicht rechtzeitig entrichtet. Der internationale Recher- 
chenbericht beschrankt sich daher auf die in den Anspruchen zuerst erwahnte Erfindung; diese ist in folgenden Anspruchen er- 
faGt: 



Bemerkungen hlnslchtllch el nee WIderspruchs | | Die zusatzlichen Gebuhren wurden vom Anmelder unter Widerspruch gezahlt. 

| | Die Zahlung zusatzlicher Recherchengebuhren erfolgte ohne Widerspruch. 
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Die vorliegende Erfindung betrifft retrovirale Expressionsvektoren mit zellspezifisch regulierbaren Promotoren. Die Vektoren 
sind beispielsweise zur zellspezifischen Expression therapeutisch wertvoller Gene im Rahmen einer Gentherapie einsetzbar. Die 
Erfindung beschreibt retrovirale Expressionsvektoren, enthaltend zumindest die nachfolgenden Elemente in funktioneller Anordnung: a) 
DNA-Sequenzen zur Verpackung der Vektor-RNA und zur zellspezifischen Expression von Proteinen oder Peptiden, die von heterologen 
DNA-Nukleotidsequenzen kodiert werden; b) eine oder mehrere fur ein Protein oder Peptid kodierende DNA-Nukleotidsequenzen, dadurch 
gekennzeichnet, da6 die DNA-Sequenzen zur zellspezifischen Expression eine zellspezifisch regulierbare Promotorregion aus einer humanen 
endogenen retroviralen DNA-Nukleotidsequenz (HERV) enthalten. 
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Retrovirale Expressionsvektoren auf der 
Basis von HERV-LTR-Sequenzen 

Die vorliegende Erfindung betrifft retrovirale Expressionsvektoren mit zellspezifisch regulier- 
baren Promotoren. Die Vektoren sind beispielsweise zur zellspezifischen Expression thera- 
peutisch wertvoller Gene im Rahmen einer Gentherapie einsetzbar. 

Retroviren sind RNA-Viren, bei denen die viralen Gene von einem einzeistrangigen RNA- 
Molekul kodiert werden. Nach Eindringen der Wen in die Zelle wird die virale RNA in ein 
doppelstrangiges DNA Molekul durch die reverse Transkription umgewandeit. Die DNA dringt 
in den Kern ein und tntegriert in das zellulare Chromosom. Die integrierte virale DNA-Form, 
das sogenannte Provirus, bildet die Matrize zur Expression der viralen Gene. 

Die Integration des viralen Genoms in das zellulare Chromosom ist ein obligatorischer Teil 
der viralen Replikation und wird durch viral kodierte Enzyme vermittelt. Es scheint, dafi, mit 
wenigen Ausnahmen, das Vorliegen des retroviralen Genoms in der Zelle, die Expression 
seiner Gene und die Bildung von Viruspartikeln die Lebensfahigkeit der infizierten Zelle nicht 
oder kaum beeintrachtigt. 

Retroviraler Gentransfer wird dazu benutzt, funktionelle Gene, insbesondere therapeutisch 
wertvolle Gene, in die Zellen einzufuhren, ohne die Proliferationsfahigkeit der Wirtszelle zu 
beeinflussen. Aufgrund ihres Replikationsmodus eignen sich Retroviren fur eine derartigen 
Gentransfer. In der einfachsten Ausgestaltungsform wird zumindest ein Teil der viralen Gene 
durch ein Gen von Interesse ersetzt und, unter Zuhilfenahme des effizienten viralen Infekti- 
onsprozesses, wird dieses Gen von Interesse in die Zielzelle transferiert. 

Retrovirale Vektoren eignen sich deshalb zur Gentherapie, weil die Infektion durch Retroviren 
hocheffizient verlauft und die retroviralen Vektoren so modifizierbar sind, dafi sie heterologe 
DNA aufnehmen und stabil in das Wirtszellgenom integrieren konnen. Eine Vielzahl von 
retroviralen Vektoren wurde in den letzten Jahren entwickelt, und nur beispielsweise wird hier 
auf die Obersichtsartikel von Giinzburg et al. (1996) und Robbins et al. (1998) hingewiesen. 
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Eine mogliche bevorzugte Ausgestaltungsform fur retrovirale Vektoren sind sogenannte Pro- 
Con-Vektoren, die zum ersten Mai in der WO 96/07748 beschrieben wurden. Zur Offenba- 
rung wird vollstandig auf diese Druckschrift Bezug genommen. 

ProCon-Vektoren tragen heterologe Promotor- und wahlweise weitere Regulationselemente 
in der 3'LTR, die, nach Infektion, dupliziert und an die 5'LTR in der Zielzelle transloziert wer- 
den und die befahigt sind, die Expression von Markergenen Oder therapeutischen Genen zu 
regulieren. Diese heterologen Gene sind nicht direkt mit dem Promotor verbunden, sondern 
werden in das Innere des Vektors inseriert 

ProCon-Vektoren umfassen einen 5'LTR-Abschnitt der Struktur U3, R, U5 sowie zumindest 
eine kodierende und/oder nicht-kodierende Sequenz sowie einen 3'LTR-Bereich, der einen 
vollstandig oder teilweise deletierten U3-Abschnitt umfa&t, wobei der deletierte U3-Abschnitt 
durch eine Polylinker-Sequenz ersetzt wurde, worauf sich der R- und U5-Abschnitt an- 
schlie&t. 

Die Vermehrung dieser Vektoren erfolgt mit Hilfe einer Helferzeilinie, die groSe Mengen der 
viralen Proteine produziert, die vom Expressionsvektor selbst nicht mehr synthetisiert wer- 
den. Die Helferzellinie ist jedoch nicht mehr in der Lage, ein replikationskompetentes Virus zu 
produzieren. Diese Zellinie wird auch als Verpackungszellinie bezeichnet und umfaSt eine 
mit mindestens einem zweiten Plasmid transfizierte Zellinie, das diejenigen Gene tragt, die 
eine Verpackung des modifizierten retroviralen Vektors ermoglichen. Wir verweisen hier z.B. 
auf die W092/10564, auf die hier vollinhaltlich Bezug genommen wird. 

Die fur das modifizierte Retrovirus (Expressionsvektor) kodierende DNA wird in die Verpa- 
ckungszellinie transfiziert. Unter diesen Bedingungen wird das modifizierte retrovirale Genom 
einschliefilich der inserierten therapeutischen Gene bzw. Markergene transkribiert und in die 
retroviralen Partikel verpackt (rekombinate virale Partikel). Dieses rekombinante Virus wird 
dann zur Infektion der Zielzellen eingesetzt; das Genom des modifizierten Retrovirus, d.h. 
des Expressionsvektors, wird in das Genom der Zielzellen integriert, und zwarzusammen mit 
den Markergenen bzw. den therapeutischen Genen. Eine mit den so erzeugten rekombinan- 
ten viralen Teilchen infizierte Zelle kann ein neues Vektorvirus nicht mehr produzieren, da in 
diesen Zellen keine weiteren viralen Proteine mehr vorliegen. Die in die Wirts * 
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zelle integrierte DNA des Expressionsvektors mit den therapeutisch wertvollen Genen bzw. 
den Markergenen liegt in der zelluiaren DNA integriert vor und kann nunmehr in der Zelle 
exprimiert werden. 

Therapeutisch wertvolle Gene, die Qber derartige retroviral Expressionsvektoren zur Ex- 
pression gebracht werden, sollen bevorzugt in zell- und gewebespezifischer Form exprimiert 
werden.Hierzu werden zellspezifische Regulationssequenzen in der LTR-Sequenz des Ex- 
pressionsvektors eingesetzt. Diese zellspezifischen Regulationssequenzen umfassen bei- 
spielsweise zellspezifisch regulierbare Promotorabschnitte, zellspezifische Enhancersequen- 
zen sowie Transkriptionsfaktor-Bindungsstellen. Die Promotoren liegen im U3-Abschnitt der 
LTR. 

Zur Zeit werden in retrovirale Vektoren zellulare Promotorsequenzen oder Promotorsequen- 
zen exogener Retroviren eingesetzt. 

Zellulare Promotoren sind haufig auf zusatzliche Signalstrukturen angewiesen, die in groBer 
Distanz stromaufwarts oder stromabwSrts des Promoters liegen konneri. Es hat sich deshalb 
immer wieder als schwierig erwiesen, starke, gewebespezifische zellulare Promotorsequen- 
zen zu isolieren und in retrovirale Vektoren zu klonieren. Promotoren exogener Retroviren 
haben den Vorteil, daB sie in der retroviralen LTR auf kleinem Raum alle benotigten reguiati- 
ven Elemente enthalten und daher weitgehend unabhangig von den benachbarten DNA- 
Sequenzen des Integrationsortes transkribiert werden. Ein schwerwiegender Nachteil ist je- 
doch, daB sie zwar sehr stark, aber nicht gewebespezifisch sind und in der Regel in alien 
Zelltypen gleich stark exprimiert werden. 

Es ist deshalb eine Aufgabe der vorliegenden Erfindung, neue retrovirale Expressionsvekto- 
ren bereitzustellen, die zwar die Vorteile der retroviralen Promotoren nutzen, alle fur die 
Transkription erforderlichen Signalstrukturen auf engem Raum innerhalb der U3 und R- 
Region zu konzentrieren, die damit verbundenen Nachteile jedoch vermeiden. 

Diese Aufgabe wird erfindungsgem3B dadurch gelost, daB in retrovirale Expressionsvektoren 
ein zellspezifisch regulierbarer Promotorabschnitt aus einer humanen endogenen retroviralen 
DNA-Nukleotidsequenz (HERV) eingesetzt wird. Diese Promotorsequenzen humaner endo- 
gener retroviraler Viren liegen bereits in der Wirtszelle vor, und es wurde erfindungs- 
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gemali gefunden, daS sie sich in hervorragender Weise zur Regulation der zellspezifischen 
Expression von Markergenen uhd therapeutisch wertvollen Genen eignen. J 

Endogene Retroviren (ERV) sind im Genom allerZellen eines Organismus zu finden. Sie 
werden vertikal uber Keimbahnzellen ubertragen und kiinnen durch Umwelteinflusse reakti- 
viert werden. Das menschliche Genom besteht zu etwa 2% aus endogenen Retroviren und 
retroviralen Sequenzen, wobei solitare HERV-LTRs mit 20000 - 40000 Kopien pro Genom 
vertreten sind (Tab. 1) (Leib-MQsch et at., 1993; Wilkinson et a!., 1994, Patience et al., 
1997). 

Da HERV-Sequenzen bereits vor 30 - 40 Millionen Jahren in das Genom von Primaten integ- 
riert sind, kann davon ausgegangen werden, daB im Verlauf der Evolution die meisten pa- 
thogenen Sequenzen durch Mutationen und Rearrangements aus dem Provirus eliminiert 
bzw. so verandert wurden, daB sie fur den Organismus nicht mehr von Nachteii sind. Retrovi- 
rale Vektoren, die aus derartigen Sequenzen konstruiert werden, haben gegenuber Vektoren 
aus animalen Wen den Vorteil, dad keine neuen viralen Sequenzen in das Genom einge- 
bracht werden mussen. Auch durch Rekombination mit bereits im Genom vorhandenen 
HERV-Sequenzen konnen keine neuartigen Retroviren entstehen, wie das z.B. der Fall ware, 
wenn Retroviren anderer Spezies als Vektoren eingesetzt werden. Aus diesem Grund kann 
die Verwendung dieser Sequenzen zur Konstruktion retroviraier Vektoren das Sicherheitsri- 
siko minimieren. Desweiteren konnten im Genom enthaltene homologe Regionen fur eine 
gewebespezifische Integration der retroviralen Vektoren in bestimme Stellen eines Chromo- 
soms genutzt werden. 

HERV-Elemente haben wahrend der Evolution eine Reihe zelluiarer Funktionen Obernom- 
men. So werden Promotor- und Enhancer-Elemente von HERV-LTRs zur Steuerung der 
Transkription zellularer Gene benutzt (Kato et al., Feuchter-Murthy et al., 1993; Di Christofa- 
no et al. v 1995). Ein Beispiel fur die Venwendung von LTR-Regulationselementen zur gewe- 
bespezifischen Expression eines zelluiaren Gens ist das Amylase-Gen des Menschen. Die- 
ses Gen wird durch die LTR eines HERV-E Elements kontrolliert und dadurch spezifisch nur 
in den Speicheldrusen exprimiert (Ting et al., 1992). Daruber hinaus haben Schulte und Mit- 
arbeiter (1996) gezeigt, daB die Insertion eines endogenen Retrovirus in die 5' nicht transla- 
tierte Region des Pleiotrophin-Gens fur dessen Trophoblasten-spezifische Aktivitat verant- 
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wortlich ist (Schulte et al., 1996). In anderen Fallen konnen polyA-Signale von HERV-LTRs 
auch dazu dienen, zellulare Transkripte zu polyadenylieren (Mager, 1989; Goodchiid et al., 
1992). 

Der groBe Vorteil beim Einsatz retroviraler Promotoren liegt darin, daB, wie bereits oben 
ausgefuhrt, alfe fur die Transkription erforderlichen Signalstrukturen auf engem Raum inner- 
halb des U3-Bereichs und des R-Bereichs der LTR lokalisiert sind, da Retroviren mSglichst 
unabhangig von der Umgebung ihres Integrationsortes transkriptionsaktiv bleiben mussen. 
Da diese HERV-Promotoren seit Miliionen Jahren im Primatengenom persistieren, haben sie 
sich im Laufe der Evolution so angepaBt, daB sie wie zellulare Promotoren zelltyp-spezifisch 
aktiv sind, und somit die Vorteiie zellularer und retroviraler Promotoren in sich vereinen. 

Die Transkription der HERVs wird von einem klassischen RNA Polymerasell-Promotor aus 
gestartet (Wilkinson et al., 1994). Dieser Promotor ist innerhalb der LTR-Region lokalisiert. 
Das HERV-Transkript besteht daher nicht aus der vollstandigen Kopie des Provirus. Urn den 
Veriust der Transkriptionskontrollelemente zu kompensieren, haben diese Elemente den Me- 
chanismus der reversen Transkription entwickelt, mit dem die verlorengegangenen Sequen- 
zen an beiden Se'rten der Elemente regeneriert werden, woraus wiederum die LTRs entste- 
hen. Neben Promotorsequenzen enthalten HERV-LTRs noch eine Vielzahi verschiedener 
Bindungsstellen fur Transkriptionsfaktoren (Seifarth et al., 1998), die fur die Gewebespezifitat 
der Expression verantwortiich sind. 

Obwohl eine gewisse strukturelle Ahnlichkeit zwischen HERVs und exogenen animalen Ret- 
roviren wie MLV oder MMTV besteht, wurden HERV-Sequenzen und insbesondere Promoto- 
ren von HERVs nie als mogliche Kandidaten fur die Entwicklung retroviraler Expressions- 
vektoren in Betracht gezogen. Sie wurden, ganz im Gegeneil, im Zusammenhang mit einer 
Gentherapie bisher ausschlieBlich als Storfaktoren betrachtet (Patience et al., 1997). Es wur- 
de befurchtet, daB sie in der Zielzelle durch Rekombinationen aufgrund von Sequenzhomo- 
logien mit dem therapeutischen Vektor interferieren konnten. Diese Befurchtungen konnten 
bislang zwar nicht experimentell bestatigt werden, jedoch mit der Entwicklung sehr effizienter 
humaner Verpackungszellinien tauchte das Problem des Mitverpackens und der ungewollten 
Obertragung m6glicherweise infektioser HERV-Sequenzen auf. Daher wurde die mogliche 
Verpackung exprimierter HERV-Sequenzen in Virionen, die auf MLV basieren, 
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ausfuhrlich untersucht. Patience et al. (1998) identifizierten mRNA-Transkripte.mehrerer ver- 
schiedener HERV-Familien wie HERV-K und HERV-H in humanen Verpackungszellinien. 
Jedoch konnten selbst mit einem hochsensitiven RT-PCR Test keine dieser Sequenzen in 
den von den Zellen freigesetzten MLV-Vektor-Partikeln nachgewiesen werden. 

Nach diesen Befunden schien eine Verpackung und Obertragung von HERV-Sequenzen und 
damit schiiefilich auch HERV-basierender Vektoren in MLV-Verpackungssystemen ausge- 
schlossen zu sein. Zwar weisen HERV-Gene eine Sequenzhomologie zu MLV-Genen von 
50 - 65 % auf, jedoch besitzen gerade die fQr die Verpackung und Infektion essentiellen Be- 
reiche, insbesondere das zwischen der 5' LTR und der gag-Region lokalisierte Verpackungs- 
signal und die LTR selbst, keine erkennbare Sequenzhomologie zu den entsprechenden 
MLV-Sequenzen. Effiziente HERV-Verpackungssysteme hingegen sind zur Zeit ebenfalls 
nicht vorstellbar, da bislang keine Zellinien bekannt sind, die in ausreichenden Mengen 
HERV-Partikel produzieren. 

Die vorliegende Erfindung lost somit das Problem von retroviralen Expressionsvektoren, die 
eine zell- und gewebespezifische Expression von Fremdgenen (Gen von Interesse) steuern, 
dadurch, daS Expressionsvektoren bereitgestellt werden, die, in funktioneller Anordnung, 
zumindest die nachfolgenden Elemente enthalten: 

a) DNA-Sequenzen zur Verpackung der Vektor-RNA und zur zellspezifischen Expression 
von Proteinen Oder Peptiden, die von heterologen DNA-Nukleotidsequenzen kodiert werden; 

b) ein Oder mehrere fQr ein Protein oder Peptid kodierende heterologe DNA- 
Nukleotidsequenzen (Transkriptionseinheif); 

die DNA-Sequenzen zur zellspezifischen Expression sind dadurch charakterisiert, daB sie 
eine zellspezifisch regulierbare Promotorregion umfassen, die aus einem humanen endoge- 
nen retroviralen Virus, insbesondere der LTR-Sequenz dieses Virus, stammen; 

Der Promotorbereich aus einer HERV-Sequenz kann den gesamten LTR-Bereich des HERV 
umfassen. In weiteren Ausfuhrungsformen der Erfindung umfaBt der Promotorbereich jedoch 
nur den U3-Bereich Oder den R-U3-Bereich der HERV-LTR. In einer weiteren bevorzugten 
Ausfuhruhgsform der Erfindung wird neben diesen Bereichen zusatzlich der nicht transla- 
tierte Bereich zwischen der 5' LTR und den gag-Genen vom Promotorabschnitt mit umfaBt. 
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Erfindungsgemafi wurde namlich festgestellt. daB auch in diesem Bereich Sequenzen lokali- 
siert sind, die eine zellspezifische Expression von Proteinen bzw. Peptiden steuern, d.h. fur 
diese zellspezifische Expression zumindest mit verantwortlich sind. 

Die Promotoren sind Teilabschnitte der DNA, die fur den Start der Transkription der zugeord- 
neten Strukturgene notwendig sind. Der Promotor beinhaltet den Startpunkt der Transkripti- 
on. die Erkennungs- und Bindungsstelle fur die RNA-Polymerase. Der Promotor kann auch 
weitere Sequenzen umfassen, an die reguiatorische Proteine binden konnen und dadurch 
spezifisch die Initiation der Transkripfion regulieren. Beispiele fur derartige Proteine sind 
Transkriptionsfaktoren und Repressoren. Beispiele fur diese Regulationselemente der 
Transkriptionsaktivitat sind die CAAT-Box, die GC-Box und die TATA-Box. Die Promotoren 
werden von einer Polymerase des Typs II erkannt. 

Die Promotorabschnitte zur zellspezifischen Expression von Fremdproteinen aus HERVs 
konnen wahlweise mit weiteren Sequenzen kombiniert werden, die aus exogenen Retroviren 
stammen und die zellspezifische Expression fordern. Auch eine Kombination mit Reguiati- 
onssequenzen aus zellularen Genen ist denkbar, urn die zellspezifische Expression zu unter- 
stutzen. 

Der erfindungsgemaSe retrovirale Expressionsvektor enthalt weiterhin zumindest DNA- 
Sequenzen zur Verpackung des Vektors durch eine Verpackungs-Helferzellinie. Die DNA- 
Sequenzen zur Verpackung sind zwischen der 5' LTR und dem gag-Gen lokalisiert. Derartige 
Verpackungssignaie sind in alien retroviralen Vektoren vorhanden und sind dem Fachmann 
deshalb bekannt. Beispiele fur Verpackungssequenzen sind aufgefiihrt in Mann et al., 1985, 
sowie Rein, 1994, sowie der dort zitierten Literatur. Auf diese Literatur wird vollinhaltlich Be- 
zug genommen. 

Der retrovirale Expressionsvektor der voriiegenden Erfindung enthalt ein oder mehrere 
Transkriptionseinheiten, die fur eine Aminosauresequenz kodieren. Die Aminosauresequenz 
steht fur ein Protein oder Peptid. Es k6nnen beliebige Sequenzen in den Expressionsvektor 
inseriert werden, die fur ein beliebiges Protein oder Peptid von Interesse kodieren. Derartige 
Proteine oder Peptide konnen beispielsweise von Markergenen, therapeutisch wertvollen 
Genen, antiviral wirkenden Genen, Antitumorgenen und/oder Zytokingenen kodiert werden. 
Diese Liste liefie sich beliebig erganzen. Die in den retroviralen Expressionsvektor einsetz- 
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baren Gene sind dem Fachmann bekannt. Die Art der eingesetzten Gene hangt vom Anwen- 
dungszweck des erfindungsgemaUen Vektors ab. 

Die erfindungemaUen Vektoren konnen beispielsweise in der Gentherapie eingesetzt wer- 
den, urn heteroioge DNA in Targetzellen zu transferieren, urn Krankheiten einer spezifischen 
Therapie zuganglich zu machen. Die Vektor-DNA wird in die ausgewahlten Targetzellen der- 
art eingefuhrt, daB die heteroioge DNA in der Zielzelle exprimiert und das durch die DNA 
kodierte Produkt produziert wird. Hierunter fallen insbesondere solche Gene zur Expression 
von Proteinen, die in der Zielzelle nicht Oder nicht mehr oder in nicht ausreichender Menge 
produziert werden, so daS sich ein Krankheitszustand einstellt. Die Erfindung umfafct riicht 
nur solche Proteine bzw. Peptide, die natiirlicherweise vorkommen, sondern auch solche, die 
in einer Weise abgeandert wurden, daB ein gewiinschter Effekt erreicht wird, beispielsweise 
eine hohere Aktivitat eines Enzyms, die Blockierung der Bindungsstelle von Wen, Zerstd- 
rung von Tumorzellen durch Suizidgene usw. 

Bei den fur ein Protein oder ein Peptid kodierenden DNA-Nukleotidsequenzen handelt es 
sich im allgemeinen urn heteroioge DNA, die fur RNA und Proteine kodiert, die normalerwei- 
se in vivo von der Zelle, in der die Proteine bzw. Peptide exprimiert werden, nicht produziert 
werden. Sie kann auch als Fremd-DNA bezeichnet werden. Beliebige Proteine, beispielswei- 
se Enzyme, Hormone und Antikorper, fallen hierunter. Die erfindungsgemaU bereitgestellten 
retroviralen Expressionsvektoren sind deshalb so ausgelegt, dad sie in menschlichen Zellen 
Proteine von Interesse exprimieren kdnnen. 

Die erfindungsgem§B eingesetzten Promotorbereiche werden aus HERV-Sequenzen aus- 
gewShlt, die aus den bekannten HERV-Familien stammen. Beispiele hierfur sind HERV-K, 
HERV-H, HERV-E, HERV-L, HERV-T, HERV-R, HERV-i, HERV-P, ERV9, HERV-W. 

Selbstverstandlich konnen auch andere, zur Zeit noch nicht bekannte HERV-Familien gesc- 
reent werden, urn noch unbekannte, die zellspezifische Expression steuernde Promotorse- 
quenzen aufeufinden. 

Erfindungsgemafi bevorzugte LTR-Sequenzen aus HERVs, die zur gewebespezifischen Ex- 
pression von Proteinen und Peptiden von Interesse einsetzbar sind, werden im Anhang 
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offenbart. Sie sind in retrovirale Expressionsvektoren einsetzbar, urn die erfindungsgemaG 
gestellte Aufgabe zu losen. Selbstverstandlich kbnnen durch an sich bekannte Methoden 
auch nur Teile dieser LTRs ausgewShlt werden, urn die in den Vektor eingesetzten Sequen- 
zen so klein wie mdglich zu halten. Mit Hilfe verschiedener Deletionsmutanten konnen die 
geeigneten Fragmente ausgewahlt werden. Auch weitere Abanderungen dieser LTR- 
Sequenzen sind mflglich, z.B. Punktmutationen, Insertionen, Additionen, Austausch mehrerer 
Nukleotide etc., um die Effizienz der gewebespezifischen Expression zu steigern und an die 
gewunschte Funktion anzupassen. " 

In einer bevorzugten AusfQhrungsform der Erfindung werden die eingangs beschriebenen 
ProCon-Vektoren eingesetzt. Derartige ProCon-Vektoren umfassen einen 5' LTR-Abschnitt 
der Struktur U3-R-U5, ein Oder mehrere Sequenzen, die fur ein Protein Oder Peptid kodieren, 
und wahlweise nicht kodierenden Sequenzen, und einen 3' LTR-Absehnitt, umfassend einen 
teiiweise Oder vollstindig deletierten U3-Abschnitt, wobei der deletierte U3-Abschnitt zumin- 
dest die erfindungsgemSB eingesetzten HERV-LTR-Sequenzen umfaBt, gefolgt vom R-U5- 
Abschnitt. Nahere Einzelheiten sind beispielsweise in der WO96/07748 und der W096/28564 
beschrieben. Auf diese Schriften wird hier vollinhaltlich Bezug genommen. 

Erfindungsgemaii wurde eine Strategie entwickelt, um zellspezifisch wirkende Promotorse- 
quenzen aufzuspQren. Diese Strategie wird in der nachfolgenden Beschreibung n§her er- 
ISutert. Selbstverstandlich sind grundsatzlich auch andere Methoden zum Auffinden von zell- 
spezifisch wirksamen HERV-LTR-Sequenzen denkbar und anwendbar. Die Erfindung ist so- 
mit nicht auf die nachfolgenden Ausfuhrungsbeispiele beschrankt. 

Die erfindungsgemaBen retroviralen Expressionsvektoren sind verpackungsdefizient, d.h. sie 
sind nicht in der Lage, ohne Hilfe einer Verpackungs-Helferzellinie Viruspartikel zu produzie- 
ren. Die Erfindung umfafit deshalb auch eine retrovirales Vektorsystem, das einen retrovira- 
len Expressionsvektor, wie er in der vorliegenden Erfindung beschrieben wird, und eine Ver- 
packungszellinie mit zumindest einem retroviralen Oder rekombinanten retroviralen Konstrukt 
enthfilt, das fur die Verpackungsproteihe des retroviralen Expressionsvektors kodiert. Derar- 
tige Verpackungszellinien sind an sich bekannt und beschrieben. Beispielsweise wird hier auf 
die murine Verpackungszellinie PA317 (Sailer et al., 1998) hingewiesen. 
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Nachfolgend wird die Erfindung zunachst allgemein und dann anhand von Ausfuhrungsbei- 
spielen beschrieben. 

ErfindungsgemaB wurde die Eignung humaner endogener Retroviren zur Entwicklung gewe- 
bespezifischer Vektoren fur die Gentherapie untersucht. Dazu wurde zunachst die Gewe- 
bespezifitat der HERV pol Transkription in verschiedenen Zeilinien wie T-Zellen, Keratinozy- 
ten und Brustkrebs-Zeilen in einem "Reverseh Dot Blot"-Verfahren uberpruft. Die Expressi- 
onsmuster der verschiedenen HERV-Famifien erwiesen sich dabei durchwegs als Zelltyp- 
abhangig. Zur Isoiierung der transkriptionsaktiveri HERV-LTRs aus verschiedenen Zeilinien 
und Geweben wurden Primer entwickelt, mit denen spezifisch die U3/R-Regionen aus 
mRNA-Praparationen amplifiziert werden konnen. Die isoiierten LTR-Sequenzen sowie ein- 
zelne Vertreter bereits bekannter LTRs wurden in Expressionsvektoren eingebaut. Die Akti- 
vitat der LTR-Promotoren wurde nach transienter Transfektion der Reporterplasmide Ciber 
Luziferaseaktivitat bzw. uber eGFP-Fluoreszenz in verschiedenen Zeilinien getestet. Es 
zeigte sich, dad die Promotoraktivitaten der einzelnen HERV-LTRs deutlich in Abhangigkeit 
von der getesteten Zellinie variieren. Die Promotorregion einer HERV-H LTR t die aus Astro- 
zyten und Leberzellen isoliert worden war und sich in mehreren Versuchen als besonders 
aktiv in Lungenfibroblastenzellen (LC5) erwiesen hatte, wurden in zwei retrovirale Promotor- 
konversionsvektoren (pLESN und PLX) eingebaut , in Verpackungszellinien getestet, die 
Veipackungseffizienz untersucht und uberprQft, ob nach Infektion der Zielzellen eine Promo- 
torkonversion stattgefunden hat. Zum Nachweis der Transkriptionsaktivitat in den Zielzellen 
wurden FACS-Analysen durchgefuhrt. 

Es wurde somit eine Methode beschrieben, mit der HERV Promotorsequenzen (U3/R- 
Region), die eine gewebespezifische Expression vermitteln, identifiziert und isoliert werden 
konnen. Die Gewebespezifitat und Promotoraktivitat dieser Sequenzen wurde dann in einem 
transienten Transfektions-Assay in verschiedenen humanen Zeilinien getestet. Schliefilich 
wurden geeignete Sequenzen ausgewahlt, in einen Promotorkonversionsvektor (ProCon- 
Vektor) kloniert und dabei ihre Eignung zur Konstruktion gewebespezifischer Vektoren fur die 
Gentherapie uberpruft. Die Herstellung der erfindungsgemaBen retroviralen Expressions- 
vektoren erfolgt durch an sich bekannte rekombinante Techniken. Derartige Techniken sind 
beispielsweise beschrieben in Sambrook et al M 1989, und Perbal, 1984. Zur Konstruk- 
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tion der ProCon-Vektoren wird auf die bereits eingangs erwahnte WO 96/07748 und die damit 
zussammenhangende Literatur verwiesen. 



3. Ergebnisse 

3.1 Analyse der HERV-Transkription in unterschiedlichen Zelltypen 

Zur Untersuchung der HERV Transkfiption in unterschiedlichen Zellen wurde im ersten 
Schritt eine Methode (Reverse Dot-Blot Hybridisierung) eingesetzt, die ursprunglich zum 
Nachweis der HERV-Expression in mononuklearen Zellen des peripheren Bluts entwickelt 
worden war (Herrmann und Kalden, 1994). Dabei wurden klonierte und charakterisierte 
HERV po/-Genfragmente aus humaner genomischer DNA auf einer Membran fixiert und mit 
radioaktiven HERV-po/ Gensonden hybridisiert. Die Sonden wurden mittels RT-PCR aus 
mRNA verschiedener Zellen unter Verwendung degenerierter Oligonukleotide amplifiziert, die 
zu einem hochkonservierten Bereich retroviraler po/-Gene homolog sind (Shih ef a/., 1989; 
Donehower ef a/., 1 990). Mit dieser Methode erhielten wir mit jeder bisher untersuchten Zelli- 
nie ein charakteristisches Hybridisierungsmuster, was einen ersten Hinweis auf eine gewe- 
bespezifische Expression der HERV Elemente darstellte. 

3.2 Isolierung von LTR U3-Regionen exprimierter HERVs 

Die gewebespezifische Expression eines Retrovirus ist vor allem durch ihre U3-Region fest- 
gelegt. In diesem Bereich sind alie regulatorischen Sequenzen wie Promotor, Enhancer und 
die Bindungsstellen fur verschiedene zellulare Transkriptionsfaktoren lokalisiert. Aus diesem 
Grund wurden Primer entwickelt, mit denen diese HERV-Sequenzen durch eine RT-PCR aus 
mRNA unterschiedlicher Zellinien gezielt isoliert werden konnten (Tab. 2; Abb.1). Auf diese 
Weise wurden ca. 30 verschiedene HERV-LTRs kloniert. Ein Teil dieser Sequenzen wurde in 
einem Reporterplasmid auf Promotoraktivitat und Gewebespezifitat getestet. 

Im ersten Ansatz wurde fur die PCR ein polydT-Primer mit einem Primer kombiniert, der 
komplementarzum Polypurin Trakt (PPT) der retroviralen RNA ist (Abb.1). Der PPT-Trakt ist 
eine konservierte Region im nicht translatierten Bereich zwischen dem env Gen und der U3- 
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Region der 3-LTR. Die PPT-Region wird wahrend der reversen Transkription des Retrovirus 
als Primerbindungsstelle fur die Synthese des Plus-Stranges genutzt (Sorge und Hughes, 
1982). 

Durch Datenbankanalysenwurden PPT-Sequenzen unterschiedlicher HERV-Familien identi- 
fiziert und durch Vergleich ihrer Homologien in verschiedene Gruppen eingeteilt. Aus den 
Konsensussequenzen der einzelnen Gruppen wurden Oligonukleotide als Primer fur die RT- 
PCR synthetisiert. Die mRNA wurde aus verschiedenen Zellinien prapariert: Epithelzellen 
(HeLa, HaCaT), Fibroblastenzellen (CC5), T-Zellen (H9, HUT78), Lymphoblasten (CML), GJi- 
omzellen (85HG66, U373), Pancreaszelien (MiaPaCa2, Panel), Leberzellen (Chang Liver) 
und Brustkrebszellinien (T47-D, MCF7). DarQber hinaus wurden zusatzlich cDNA Genban- 
ken (Clontech) verschiedener menschlicher Gewebe (Gehirn, Herz, Leber, Niere, Lunge, 
Pankreas, Plazenta, Skelettmuskel) fur die RT-PCR eingesetzt. 

Die erhaltenen Fragmente wurden anschliedend kioniert, sequenziert und mittels Datenbank- 
vergleichen analysiert. Von den PCR-Fragmenten, die mit den PPT- und den polydT-Primern 
erhalten wurden, konnten zwei LTRs uber Homologievergleiche der HERV-H und der HERV- 
K Familie zugeordnet werden. Durch die Verwendung von polydT-Primern in diesen PCR- 
Ansatzen wurden zahlreiche Sequenzen amplifiziert, die keine Homologien zu bekannten 
retroviralen LTRs und daruber hinaus auch keine Promotorstrukturelemente enthielten. Aus 
diesem Grund wurden weitere Sequenzen aus konservierten Bereichen der U3-Region und 
aus der R-Region von HERV-K und HERV-H Familien zur Primersynthese ausgesucht (Mold 
et a/.,1997),(Abb.1, Tab.1). Die resultierenden PCR-Produkte wurden nach Auftrennung im 
Agarosegel auf Nitrozellulosefilter transferiert und mit Sonden hybridisiert, die aus den LTR- 
Regionen verschiedener HERV-LTRs (HERV-K-pl167, HERV-H-H6, HERV-E, HERV-L) pra- 
pariert wurden. Die hybridisierenden Fragmente wurden anschlie&end in einen Vektor (pZE- 
RO, Invitrogen) kioniert und sequenziert. Mit dieser Methode konnten verschiedene HERV- 
LTRs isoliert werden, die in Tabelle 3 aufgelistet sind. 

Die HERV-K-LTRs, die aus menschlichem Gehirn und Herzgewebe sowie aus T47-D Zellen 
isoliert wurden, zeigen sehr hohe Sequenzhomologien zu der 3'LTR von HERV-K10. Die 
HERV-H LTRs zeigen dagegen sehr viel hdhere Sequenzvariabilitaten. HERV-H31, HERV- 
H3, HERV-HCM1, HERV-HCM4, HERV-HMP23 sind homolog zu der von Mager et a/, iso- 
lierten HERV-H-H6 LTR, die anderen HERV-H Sequenzen zeigen Homologien zu den von 
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Anderssen et al. (1997) isolierten HERV-H LTRs aus Meerkatze, Krallenaffe und Mensch. 
Die aus T47-D Zellen isolierten HERV-W LTRs sind mit der LTR des Klons CL6 (Komurian- 
Pradel, 1999) verwandt. 



3.3 Analyse der Expression von HERV-Promotoren in einem transienten 
Luziferase-Assay 

Zur Analyse der Promotoraktivitat und der Gewebespezifitat der isolierten HERV-LTRs wur- 
den diese zunachst in ein Luziferasereporterplasmid (pBL, Butz, K., DKFZ, Heidelberg) klo- 
niert. Dieser Vektor enthSIt das Photinus pyralis Luziferasegen, fusioniert an das SV40 polyA 
Signal von pBLCAT2 (Hoppe-Seyler et al., 1991). 

Die einzelnen Vektorkonstrukte wurden transient in verschiedene Zellinien transfiziert. Nach 
48 h wurde die Luziferaseaktivitat aus dem Zellysat mit dem Luziferase-Assay Kit von Pro- 
mega gemessen und nach Abgleichen der R-Galaktosidaseaktivit§t bzw. der Renilla- 
Luziferaseaktivitat als relative Luziferaseaktivitat bestimmt. Die Promotoraktivitaten der LTRs 
wurden in Epithelzellen (HeLa, HaCaT). Fibroblastenzellen (LC5), T-Zellen (H9, HUT78), 
Gliomzellen (85HG66, U373), Leberzellen (Chang Liver), Pancreaszellen (MiaPaCa2, Panel) 
und Brustkrebszellinien (T47-D, MCF7) bestimmt. 

Die Ergebnisse sind in den Abbildungen 2a - 2f dargestellt. Die HERV-H-H6 LTR besitzt 
demnach von alien untersuchten endogenen LTRs den starksten Promotor. Die HERV-K 
LTR aus Plazenta ist in HeLa-Zellen besonders aktiv. In alien anderen Zellinien ist diese LTR 
nur sehr schwach aktiv. Ebenfalls eine starke Aktivitat in HeLa Zellen zeigte HERV-K-T47-D, 
diese LTR war auch in HaCat-Zellen und Pankreaszellen aktiv. Die HERV-L LTR besitzt in 
Leberzellen eine starke Promotoraktivitat und ist in T-Zellen und Pankreaszellen schwach 
aktiv. Die HERV-T-S71 A und HERV-E LTRs waren in keiner getesteten Zelline aktiv. Ebenso 
konnte bisher keinerlei Aktivitat einer HERV-LTR in CML-Zellen beobachtet werden. 

Die klonierten . HERV-H LTRs (HERV-H1, HERV-H8, HERV-H 13, HERV-H19, HERV-H-H6, 
Tab. 3) waren fast alle in 85HG66 Zellen aktiv, wobei HERV-H 1 und HERV-H8 in dieserZel- 
linie die hdchste Aktivitat zeigten (ohne Abb). HERV-H19 war in HeLa-Zellen sehr aktiv. Die 
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HERV-HCM1 LTR zeigte in alien Zellinien die hochste Promotoraktivitat und war besonders 
in Lungenfibroblasten (LC5) aktiv (Abb. 3). 

3.4 Konstruktion von HERV-Hybrid-Vektoren und Uberprufung der Aktivitaten von 
HERV- Promotoren in diesen Vektoren 

Die Funktionsfahigkeit menschlicher endogener retroviraler LTR Sequenzen in retroviralen 
Vektoren wurde in zwei unterschiedlichen Promotorkonversionsvektoren (ProCon) ausge- 
testet. Dazu wurden hybride HERV/MLV Vektoren unter Verwendung zweier auf MLV basie- 
render Vektoren pLESN-MMTV (Abb. 7) und pLX-MMTV (Abb. 8) konstruiert. Diese Vektoren 
enthalten das EGFP Gen als Reportergen, das von der 5' LTR (unterschiedlich, je nachdem 
ob vor oder nach der Promotorkonversion) aus exprimiert wird, sowie ein Neomycingen, das 
von einem SV40 Promotor aus exprimiert wird. Daruberhinaus enthalt der Vektor pLX-MMTV 
einen prokaryotischen Replikationsorigin, der die Reklonierung des Provirus fur weitere mo- 
lekulare Charakterisierungen erlaubt. 

Zur Konstruktion der HERV-Hybrid Vektoren wurde jeweils die MMTV-LTR durch die HERV- 
HCM1 LTR ersetzt (Abb. 7). Dazu wurde die LTR zunachst mittels PCR aus dem VektorpBL- 
HERV-H mit spezifischen Primern amplifiziert, die zusatzliche Sequenzen fur die Restrikti- 
onsenzyme Mlul und Sacll enthielten. Diese Fragmente wurden anschlie&end in die 3'U3 
deletierten Vektoren eingebaiit. Das Reportergen EGFP wird nach der Transfektion in die 
Verpackungszellinie zunachst vom MLV Promotor aus exprimiert. (Abb 9a) Nach Infektion 
der Zielzellen und erfolgreicher Promotorkonversion durch die reverse Transkription in den 
Zielzellen liegt das Reportergen unter der Transkriptionskontrolle der HERV LTR vor. 

Die HERV-Hybrid Vektorkonstrukte pLESN-HERV-H (Abb. 7) und pLX-HERV-H (Abb.8), so- 
wie die Ursprungsvektoren pLESN-MMTV und pLX-MMTV wurden in die amphotrophe Ver- 
packungszellinie PA317 transfiziert. Die resultierenden retroviralen Vektorpartikel wurden 
anschliefiend benutzt, urn die Zellinien CrfK und LC5 zu infizieren. 

Die infizierten Zellinien wurden kloniert und die selektionierten Zellklone daraufhin untersucht, 
ob sie die Vektorkonstrukte enthielten und ob die Promotorkonversion stattgefunden hatte. 
Dazu wurde aus infizierten und nicht infizierten Zellen chromosomale DNA prapariert 
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und mittels PCR analysiert Die Primer wurden aus der MLV U3 (P5) und R (P2) Region so- 
wie aus der HERV-H Region (P1) ausgesucht und in Kombination mit einem Primer aus der 
EGFP Region fur eine PCR eingesetzt (Abb. 9a). Die PCR-Produkte wurden mit HERV-H 
spezifischen Sonden hybridisiert (Abb. 9b). Dabei ergab die DNA, die mit denpLX HERV-H 
Partikeln infiziert wurden, nach Amplifikation mit den Primem P1 und P3 ein PCR Produkt 
von 1,1 kb, das mit der HERV-H-Sonde hybridisierte. Die Amplifikation mit den MLV U3 spe- 
zifischen Primem (P2/P3) ergab mit DNA von Zellen, die mitpLX und mit pLX HERV-H infi- 
ziert waren, PCR Produkte mit einer GroBe von etwa 900 bp, die nicht mit der HERV-H Son- 
de hybridisierten. Aus der Amplifikation mit den MLV R Primem (P5/P3) wurde kein PCR- 
Produkt erhalten, das mit der HERV-H Sonde hybridisierte. Diese Ergebnisse zeigen, daft 
eine Promotorkonversion stattgefunden hat und der MLV Promotor der 5'LTR durch den 
HERV-Promotor ersetzt worden war. 

Die Promotoraktivitat der HERV LTR in den retroviralen Vektoren wurde nach Integration in 
die DNA der Zielzellen mittels FACS-Analysen uber die Messung der EGFP Fluoreszenz 
bestimmt (Abb. 10). Die Aktivitat des Ausgangsvektors pLX-MMTV wurde dabei mit dem 
HERV-Vektor pLX-HERV-H (H6) vor und nach Induktion mit Dexamethason verglichen. Der 
Vektor mit der MMTV LTR ist durch Dexamethason aktivierbar. Der Vektor mit der HERV 
LTR wird durch Dexamethason nicht aktiviert, er ist jedoch urn etwa den Faktor 10 aktiver ais 
der Dexamethason-stimmulierte MMTV-Hybrid-Vektor. 



3.5 EinfluB von Regulationselementen in R- und U5-Region auf die Promotoraktivitat 
von HERV-Sequenzen. 

Urn auszutesten, welcher Sequenzbereich fur einen funktionsfShigen HERV-Promotor erforder- 
lich ist, wurde an einigen Beispielen der EinfluB von zusatzlichen LTR-Sequenzen, die auBer- 
halb der U3-Region in der LTR lokalisiert sind, untersucht. Dazu wurde von 7 HERV-K LTRs 
(HERV-K-T47D, L5, L50, L8, L9, L48 und L20/49) die Aktivitat der U3-Region mit der Aktivitat 
der entsprechenden U3-R-Fragmente im Luziferase-Assay verglichen. Oberraschenderweise 
zeigte sich, daB die verschiedenen R-Regionen den Promotor in der U3-Region sehr unter- 
schiedlich beeinflussen konnen. Bei LTRs der Gruppe 1 (L5, L50, L8, L9) fuhrt die Anwesenheit 
von R-Sequenzen in alien getesteten Zellinien zu einem deutlichen Anstieg der Pro- 
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motoraktivitat (Abb. 4a). Bei LTRs der Gruppe 2 (L20/L49) hingegen wird die Aktivitat des 
HERV-Promotors durch die R-Region reduziert (Abb. 4b), Der HERV-K-T47D-Promotpr (Abb. 
5) und der L48-Promotor (ohne Abbildung) werden durch die entsprechenden R-Sequenzen 
nicht wesentlich beeinflu&t. Interessanterweise haben jedoch im Falle der HERV-K-T47D-LTR 
Sequenzbereiche, die downstream der U3-R-Region lokalisiert sind und die U5-Region, sowie 
den 3' nicht translatierten Bereich und den Beginn des gag-Gens umfassen, einen deutlich 
aktivierenden Effekt (Abb. 5). 



Die Sequenzanalyse der verschiedenen getesteten R-Regionen zeigte, da& LTRs der Grup- 
pe 1 in der R-Region eine Bindungsstelle fur den Transkriptionsfaktor SP1 aufweisen, die in 
der R-Region der Gruppe 2 LTR fehlt (Abb. 6). Dagegen enthalt die Gruppe 2 R-Region eine 
potentielle Bindungsstelle fur den Faktor TFS3, der als Transkriptionsrepressor wirkt. Dies 
zeigt, dafi die Aktivitat von HERV-Promotoren durch den Einbau zusatzlicher Regulations- 
eiemente wie Transkriptionsfaktorbindungsstellen, Enhancer-Sequenzen Oder negativ regu- 
lierende Elemente modifiziert werden kann. 
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Patentansprtiche 

Retroviraler Expressionsvektor, enthaltend zumindest die nachfolgenden Elemente In 
funktioneller Anordnung: 

a) DNA-SequenzenzurVerpackungderVektor-RNAundzurzellspezifischen Ex- 
pression von Proteinen oder Peptiden, die von heterologen DNA-Nukleo- 
tidsequenzen kodiert werden; 

b) ein Oder mehrere f£ir ein Protein Oder Peptid kodierende DNA-Nukleotidse- 
quenzen, 

dadurch gekennzeichnet, 

da& die DNA-Sequenzen zur zellspezifischen Expression eine zellspezifisch regu- 
lierbare Promotorregion aus einer humanen endogenen retroviralen DNA-Nukleotid- 
sequenz (HERV) enthalten. 

Expressionsvektor nach Anspruch 1, 
dadurch gekennzeichnet, 

daS die DNA-Sequenzen zur zellspezifischen Expression aus dem LTR-Bereich und 
wahlweise dem nicht translatierten Bereich zwischen der 5' LTR und dem gag- 
Bereich von HERVs stammen. 

Vektor nach Anspruch 1 oder Anspruch 2, 
dadurch gekennzeichnet, 

dafi der gesamte LTR-Bereich, der U3-Bereich oder der R- und U3-Bereich aus einer 
humanen endogenen retroviralen Nukleotidsequenz stammt. 

Vektor nach einem oder mehreren der vorhergehenden Ansprilche, 
dadurch gekennzeichnet, 

da& die fQr ein oder mehrere Proteine oder Peptide kodierende Nukleotidsequenzen 
ausgewShlt werden aus einem oder mehreren Elementen der Gruppe, bestehend aus 
Markergenen, therapeutischen Genen, antiviralen Genen, Antitumorgenen und Zyto- 
kingenen. 
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4. Vektor nach einem Oder mehreren der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daB die zellspezifisch reguiierbare Promotorregion aus dem LTR-Bereich einer zell- 
spezifisch exprimierten endogenen humanen retroviralen Nukleotidsequenz stammt. 

5. Vektor nach einem Oder mehreren der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daB die humanen endogenen retroviralen zellspezifisch regulierbaren Promotorse- 
quenzen ausgewShlt werden aus einem oder mehreren Promotorsequenzen von 
HERV-Familien der Gruppe, bestehend aus HERV-K, HERV-H, HERV-E, HERV-L, 
HERV-T, HERV-R, HERV-I, HERV-P, ERV9. HERV-W. 

6. Vektor nach einem oder mehreren der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daB die Promotorregion neben der TATA-Box weitere Erkennungs- und Bindungs- 
stellen fur regulatorische Proteine umfa&t. 

7. Vektor nach Anspruch 7, 
dadurch gekennzeichnet, 

daB die Erkennungs- und Bindungssteilen fQr regulatorische Proteine die GC-Box ( die 
CAAT-Box, Enhancersequenzen und Repressorsequenzen sowie Hormon-re- 
sponsible Sequenzmotive umfassen und daB wahlweise zusatzlich Erkennungs- und 
Bindungssteilen fur regulatorische Proteine aus der LTR-Region exogener Retroviren 
und/oder aus zellularen Genen enthalten sind. 

8. Vektor nach einem oder mehreren der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daB der Vektor ein Promotor-Konversionsvektor ist, umfassend einen 5 1 LTR-Ab- 
schnitt der Struktur U3-R-U5, ein oder mehrere Sequenzen, ausgewahlt aus kodie- 
renden und nicht kodierenden Sequenzen, und einen 3* LTR-Abschnitt, umfassend 
einen teilweise oder vollst§ndig deletierten U3-Abschnitt, wobei der deletierte U3- 
Abschnitt durch eine zellspezifisch reguiierbare Promotorregion aus einer HERV- 
LTR-Sequenz ersetzt ist, gefolgt vom R-U5-Abschnitt. 
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9. mRNA Oder RNA eines retroviralen Expressionsvektors nach einem oder mehreren 
der vorhergehenden Anspruche. 

10. Prokaryontenzelle Oder Eukaryontenzelle, enthaltend einen retroviralen Expres- 
sionsvektor nach einem oder mehreren der vorhergehenden Anspruche. 

11. Eukaryontenzelle, enthaltend einen retroviralen Expressionsvektor nach einem oder 
mehreren der vorhergehenden Anspruche in integrierter Form. 

12. Verwendung eines zellspezifisch regulierbaren Promotorabschnitts aus einer huma- 
nen endogenen retroviralen DNA-Nukleotidsequenz zur Steuerung der Expression 
von Fremdgenen in retroviralen Expressionsvektoren, bevorzugt ProCon-Vektoren. 

13. Verwendung eines Expressionsvektors nach einem oder mehreren der vorherge- 
henden Anspruche zur Expression von Fremdgenen in der Gentherapie. 

14. Virion, enthaltend eine retrovirale Expressionsvektor-RNA, abgeleitet von einer Ex- 
pressionsvektor-DNA nach einem oder mehreren der vorhergehenden Anspruche. 

15. Verfahren zur Herstellung eines Virions nach Anspruch 15 zum Einfuhren einer oder 
mehreren fur ein Protein oder Peptid kodierender Nukleotidsequenzen, 

dadurch gekennzeichnet, 

daB der retrovirale Expressionsvektor nach einem oder mehreren der vorhergehen- 
den Anspruche in eine geeignete Verpackungszellinie unter solchen Bedingungen 
eingebracht wird, datt das Virion ausgebiidet wird und von der Verpakungszellinie 
freigesetzt wird. 

16. Verfahren zum Einfuhren von Nukleotidsequenzen, die fur ein oder mehrere Proteine 
oder Peptide kodieren, in eine Eukaryontenzelle, 

dadurch gekennzeichnet, 

dafi die Zelle mit einem Virion nach Anspruch 15 unter solchen Bedingungen infiziert 
wird, daB die fur das Protein oder Peptid kodierende Nukleotidsequenzen in die chro- 
mosomale DNA der Eukaryontenzelle inserted wird. 
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17. Verfahren nach Anspruch 17, 
dadurch gekennzeichnet, 

daU die Eukaryontenzelle eine Saugerzelle ist. 

1 8. Verfahren nach Anspruch 1 8, 
dadurch gekennzeichnet, 

dafi die Saugerzelle eine menschliche Zelle ist. 

1 9. Retrovirales Vektorsystem, umfassend einen retroviralen Expressionsvektor nach 
einem oder mehreren der vorhergehenden Anspruche und eine Verpackungszeliinie 
mit zumindest einem retroviralen oder rekombinanten retroviralen Konstrukt, das fur 
die Verpackungsproteine des retroviralen Expressionsvektors kodiert. 

20. Retrovirales Vektorsystem nach Anspruch 20, 
dadurch gekennzeichnet, 

da& die Verpackungszeliinie retrovirale oder rekombinante retroviral Konstrukte ent- 
halt, die fur solche retroviralen Proteine kodieren, die vom retroviralen Expressions- 
vektor nicht kodiert werden. 
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Tab. 1: Human endogenous retroviral elements 
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Tab. 2: Primers used for the amplification of different HERV-LTR-regions 



Nr. 


Primer 


Sequence 


34 


HERV-K 


ATGGCGGTTTTGTCGAA 


35 


HERV-K 


GTTCCMTYAGTATTTATTGATC 


36 


HERV-K 


ATGGAGCATACAATCGGG 


3 


HERV-K 


AAGAAAAGGGGGAAATGTGGG 


11 


HERVKC4 


AAAGGGAGGGGGGCATG 


12 


HERV-KT47-D 


TAAAAAGGGGGGAGATG 


1 


HERV-H 


ATGTGAGCAACATGGCTGTTTATTTC 


2 


HERV-H 


TGTCAGGCCTCTGAGCCCAA 


39 


HERV-H 


GCCATCTCGAGTGTCAGSCCTCTGAGYCYARGC 


37 


HERV-H 


TATCTTGAATTCGKGTGAGCAAYAARRCTTTA 


31 


polvdT 


I I I I I I I I I I I J! I r I T 


17 


HERV-E 


AAAGGGGGGGAAATATG 


18 


HERV-L 


AGGGGTGGGACTTGCGATG 


19 


HERV-W 


TGTTGAGATGGGGGACTGAG 


20 


HERV-W 


GCAGTTGCAAGATTTAATAGAG 
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A: HERV-LTRs from different cell lines and tissues 





Primer 


Herkunft 


Homology 


HERV-K2 


34/36 


T47-D 


HERV-K10. M12B54, 97,9 % 


HERV-K3 


34/36 


T47-D 


HERV-K10, M12854. 98.4 % 


HERV-K22-K32-K27-K45 


34/36 


brain 


HERV-K10, M12854, 98,6 % • 


HERV-K30 


3/31 


heart 


HERV-K10, M 12854. 97,6 % 


H ERV-K-T47D-L5 




T47-D 


MRSV, AF 127229 


HERV-K-T47D-L50 




T47-D 


MRSV, AF127229 


HERV-K-T47D-L8 




T47-D 


MRSV, AF1 27229 


HERV-K-T47D-L9 




T47-D 


MRSV, AF 1 27229 


HERV-K-T47D-L48 




T47-D 


MRSV, AF 127229 


HERV-K-T47D-L20 




T47-D 


MRSV, AF 1 27229 


HERV-1P-T47D 




T47-D 


MRSV, AF 1 27229 


HERV-T47D-W2 


19/20 


T47-D 


MRSV, AF 127229 


HERV-T47D-W4 


19/20 


T47-D 


MRSV, AF 1 27229 


HERV-T47D-W5 


19/20 


T47-D 


MRSV, AF 1 27229 


HERV-W1 


19/20 


T47-D 


MRSV, AF 127229 


HERV-W10 


19/20 


T47-D 


MRSV, AF 1 27229 


HERV-W11 


19/20 


T47-D 


MRSV. AF127229 


HERV-W18 


19/20 


T47-D 


MRSV. AF 127229 


HERV-W2 


19/20 


T47-D 


MRSV, AF 127229 


HERV-W22 


19/20 


T47-D 


MRSV. AF 127229 


HERV-W23 


19/20 


T47-D 


MRSV, AF 1 27229 


HERV-W4 


19/20 


T47-D 


MRSV. AF127229 


HERV-W5 


19/20 


T47-0 * 


MRSV. AF 127229 


HERV-W6 


19/20 


T47-D 


MRSV. AF127229 


HERV-W8 


19/20 


T47-D 


MRSV, AF127229 


HERV-H1 


1/2 


H9 


Cercopithecus aethiops ERV-H; U96012. 87,1% 


HERV-H8 


1/2 


HUT 


HERV-H LTR18106. 84,8% 


HERV-H1 3 


1/2 


HUT 


HERV-H LTR18106, 91.8% 


HERV-H19 


1/2 


liver 


Callithrix jacchus ERV-H, 5*LTR; U96052, 92,1% 


HERV-H31 


1/2 


liver 


HERV-H(H6) X12717, 99,8% 


HERV-H3 


1/31 


85HG66 


HERV-H(H6) X12717, 100 % 


HERV-H CL1 


1/2 


Chang Liver 


HERV-H(H6) X12717, 100 % 


HERV-H CL2 


1/2 


Chang Liver 


HERV-H LTR18106. 84 % 


HERV-H CL3 


1/2 


Chang Liver 


Callithrix jacchus ERV-H. 5'LTR Silva 5. U96057. 84.2 % 


HERV-H CL4 


1/2 


Chang Liver 


HERV-H(H6) X12717, 100 % 


HERV-H PA7 


1/2 


Panel 


Callithrrx jacchus ERV-H. 5LTR Siiva 4, U96062, 85.7 % 


HERV-H PAS 


1/2 


Panel 


Cercopithecus aethiops ERV-H. Vero 22, U96012. 87.1% 


HERV-H PA9 


1/2 


Panel 


HERV-H LTR18106, 85 % 


HERV-H PA10 


1/2 


Panel 


Callithrix jacchus ERV-H. 5*LTR Silva 4. U96062. 85.6 % 


HERV-H MC14 


1/2 


MCF7 


Cercopithecus aethiops ERV-H. Vero 22. U96012. 86.6% 


HERV-H MC15 


1/2 


MCF7 


Cercopithecus aethiops ERV-H. U96012. 86.6 % 


HERV-H MC16 


1/2 


MCF7 


Callithrix jacchus ERV-H, 5XTR Silva 4. U96062, 87,4 % 


HERV-H MC17 


1/2 


MCF7 


Cercopithecus aethiops ERV-H. Vero 22. U96012, 86.6% 


HERV-H MP20 


1/2 


MiaPaca 


Human beta globin retrovirus-like repetitive element. k01891. 92.8 % 


HERV-H MP21 


1/2 


MiaPaca 


HERV-H LTR18106. 89.2 % 


HERV-H MP23 


1/2 


MiaPaca 


HERV-H(H6) X12717. 99,5 % 
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B: HERV-LTRs published in the literature 
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reference 


HERV-K-PH67 


970 


Leib-Mosch era/. 1993 


HERV-K-T47-D 


1200 


Seifarth era/.. 1998 


HERV-H-H6 


393 


Feuchter und Mager. 1990 


HERV-T-S71A 


625 


Murr. Dissertation. 1998 


HERV-E 


391 


Steele era/.. 1984 


HERV-L 


462 


Cordonnier et a/.. 1995 
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Abb. 2g : relative promoter activity of different HERV-LTRs in different cell lines 
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Fig. 4: LTR-R region modulates promoter activity of HERV-K-T47D related LTRs 
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Fig.7: Retroviral ProCon vectors pLESN-MMTV and pLESN-HERV-H 
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Fig.8: Retroviral ProCon vectors pLX-MMTV and pLX-HERV-H 
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Fig. 9: a) Promoter conversion of the hybrid ProCon vectors 

b) Demonstration of the correct promoter conversion with PCR and hybridization 
with a HERV-H and a psi probe (1 :CK; 2:CK-pLX-MMTV; 3:CK-pLX-HERV-H) 






Ftg.10: a) organization of the two ProCon vectors pLX-MMTV and pLX-HERV-H 

b) promoter activity of the HERV-H LTR in comparison to the MMTV-LTR by 
infection of CrfK cells 



WO 00/53789 




PCT/EP00/02064 



Appendix 

A. HERV-H LTR sequences 



22/29 



HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 



H Ml 
H HCM2 
H 19 
H MP 20 
H CM3 
H MCI 6 
H CM1 
H MP23 
H H13 
H HI 
H HU8 
H PA7 



HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 



Ml 

HCM2 

19 

MP 20 

CM 3 

MC16 

CM1 

MP23 

H13 

HI 

HU8 

PA7 



TGTCAGGCCT 
TGTCAGGCCT 
TGTCAGGCCT 
TGTCAGGCCT 
TGTCAGGCCT 
TGTCAGGCCT 
TGTCAGGCCT 
TGTCAGGCCT 
TGTCAGGCCT 
TGTCAGGCCT 
TGTCAGGCCT 
TGTCAGGCCT 

51 

CGTATACATC 
CGTATACATC 
CATATACATC 
CGTACACATC 
CGTGTATGCC 
CGTATACATC 
CGTATACGCC 
CGTATACGCC 
CGTATACATC 
CGTGTACATC 
. . TATACATC 
CGTGTACATC 



CTGAGCCCAA 
CTGAGCCCAA 
CTGAGCCCAA 
CTGAGCCCAA 
CTGAGCCCAA 
CTGAGCCCAA 
CTGAGCCCAA 
CTGAGCCCAA 
CTGAGCCCAA 
CTGAGCCCAA 
CTGAGCCCAA 
CTGAGCCCAA 



CAGATAGCC . 
CAGATGGCC . 
CAGATGGCC . 
CAGATGGCCG 
CAGATGGCC . 

CAGATG 

CAGATGGCC . 
CAGATGGCC . 
CAGATGGCC . 
CAGATGACC . 
CAGATGGCC . 
CAGATGACC . 



GCTAAGCCAT 
GCCAGGCCAT 
GCTAAGCCAT 
GCTAAGCCAT 
GCCAAGCCAT 

GCC 

GCCAAGCCAT 
GCCAAGCCAT 
GCTAAGCCAT 
GCTAAGCCAT 
GCTAAGCCAT 
GCTAAGCCAT 



TGAAG 

TAAAG 

TGAAG 

GTTCCTGCCT 

TGAAG 

AAG 

TGAAG 

TGAAG 

TGAAG 

TGAAG 

TGAAG 

TGAAG 



CATATCCCCT 
CGCATCCCCT 
CATATCCCCT 
CATATCCCCT 
CGCATCCCCT 



CGCATCCCCT 
CGCATCCCCT 
CATATCCCCA 
CAAATCCCCT 
CATATCCC . . 
CAAATCCCCT 



50 

GTGACCTGCA 
GTGACTTGCA 
GCGACCTGCA 
GTGACCTGCA 
GTGACTTGCA 

TGCA 

GTGACTTGCA 
GTGACTTGCA 
GGGACCTGCA 
GTGACCTGCA 
GTGACCTGCA 
GTGACCTACA 

100 



CAACTG .... 
T AAC TGAAG A 
TAACTGAAGA 
TAACTGATGA 
TAACTGAAGA 
CAAGTGAAGA 
TAACTGAAGA 
TAACTGAAGA 
CAACTGAAGA 
CAACTGAAGA 
CAACTGAAGA 
CAACTGAAGA 



TCCA 

ATCA 

CATTCCACCA 

ATCA 

ATCA 

ATCA 

ATCA 

TCCA 

TCCA 

TCCA 

TCCA 



101 



HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 



Ml 

HCM2 

19 

MP20 

CM3 

MC16 

CM1 

MP23 

H13 

HI 

HU8 

PA7 



CAAAAGAAGT 
CAAAAGAAGT 
CGAAAGAAGT 
CAAAAGAAGT 
CAAAAGAAGT 
CAAAAGAACT 
CAAAAGAAGT 
CAAAGGAAGT 
CAAAAGAAGT 
CAAAGGAAGT 
CAAAAGAAGT 



150 

AAAAATATCC TTAACTGATG ACA TTCCAATA 

AAAAACAGCC TTAACTGATG ACA TTCCAACA 

GAAAATGGCC TGTTCC 

GAAAATGACC TGTTCG 

GAAAAGGCCC TGCCCC 

GAAAATGGCC GGTTCC 

GAAAAGGCCC TGCCCCGCCT TAACTGATGA CATTCCACCA 
GAAAAGGCCC TGCCCCGCCT TAACTGATGA CATTCCACCA 

GAAAATAGCC TTAACTGATG ACA TTCCACCA 

GAAAGTAGCC TTAACTGATG ACA TTCCACCA 

GAAAATAGCC TTAACTGATG ACA TTCCACCA 

GAAAGTAGCC TTAACTGATG ACA TTCCACCA 



HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 



Ml 

HCM2 

19 

MP20 

CM3 

MC16 

CM1 

MP23 

H13 

HI 

HU8 

PA7 



151 

TTGTGATTTG TTTCTGCCCT 
TTGTGATTTG TTCCTGCCCC 

T 

T 



TGGTGATTTG TTCTTGCCCC 
TGGTGATTTG TTCTTGCCCC 
TTGTGATTTG TTTCTGCCCC 
TTGTGATTTG TTCCTGCCCC 
TTGTGATTTG TTCCTGCCCC 
TTGTGATTTG TTCCTGCCCT 



ACCCTGACTG 
ACCCTAACTG 
GCCTTAACTG 
GCCTTAACTG 
ACCTTAACTG 
GCCTTAACTG 
ACCTTAACTG 
ACCTTAACTG 
ATCCTAACTG 
ACGCTAACTG 
ACGCTAACTG 
ACGCTAGCTG 



ATCAATGTGC 
ATAAATGTAC 
ATGACATTAC 
ATGACATTGT 
AGTGATTAAC 
ATGACATTAC 
AGTGATTAAC 
AGTGATTAAC 
ATCAATGTAC 

AT AC 

AT AC 

AT AC 



200 

TTTGTAATCT 
TTTGTAATCT 
CTTGTGAAAT 
CTTGTGAAAT 
CCCATGAATT 
CTTGTGAAAT 
CCTGTGAATT 
CCTGTGAATT 
TTTGTAATCT 
CATATATTCT 
CATATATTCT 
CATATATTCT 



HERV-H Ml 
HERV-H HCM2 
HERV-H 19 
HERV-H MP20 
HERV-H CM3 
HERV-H MC16 



201 250 
CCCCCACCCT TCAGAAGGCT CTTTGTAATC CTCCCCACCC TTGAGAATGG 
CCCCCACCCT TAAGAAGGTC CTTTGTAATT CTCCCCACCC TTGAGAGTGT 
TCCTTCTCCT GGCTCATCCT GGCTCAAAAG CTC. .CCGCA CTGAG. . . .C 
TCCTCCTCCT GGCTCATCCT GGCTCAAAAG CTC . . CCCGA CTGAG . . . . T 
TCCTTCCCCT GGCTCAG AAG CTC. .CCCCA CTGAG. . . .C 



rCCTTCTCCT GGCTCAG. 



. . AAG CTC . . CCCCA CTGAG . . . . C 
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HERV-H CM1 
HERV-H MP23 
HERV-H H13 
HERV-H HI 
HERV-H HU8 
HERV-H PA7 



HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 



H L31 
H HCM2 
H 19 
H MP20 
H CH3 
H MC16 
H CM1 
H MP23 
H H13 
H HI 
H HU8 
H PA7 



23/29 

TGCTTCTCCT GGCTCAG AAG CTC. .CCCCA CTGAG. . . .C 

TGCTTCTCCT GGCTCAG AAG CTC. .CCCCA CTGAG C 

CTCCCACCCT TAAGAAGGTT CTTTGTAATT CTCCCCACCC TTGAGAGTGT 

TCCCC CGCCC TTGAGAATGT 

TCCCC CGCCC TTGAGAATGT 

TCCCC CGCCC TTGAGAATGT 



251 

ACTTGGTGAG 
ACTTTGTGAG 
ACCTTGTGAC 
ACATTGTGAC 
ACCTTGTGAC 
ACCTTGTGAC 
ACCTTGTGAC 
ACCTTGTGAC 
ACTTTGTGAG 
ACTTTGTA. . 
ACTTTGTA . . 
ACTTTGTA. . 



ATCCACCCCC 
ATCCACACCT 
CCCTGCCTCT 
CCCCACTCCT 
CCCTGCCCCT 
CCCCACTCCT 
CCCCGCCCCT 
CCCCGCCCCT 
ATCCACCCCC 



TGCCTGCAAA 
GCCCACCAGA 
GCCCGCCAGA 
GCCCGCCAGA 
GCCCACCAGA 
CCCCGCCACA 
GCCCACCAGA 
GCCCACCAGA 
TGCCGGCAAA 



GCATTGCCCC 
GAACAAACCC 
GAGCAACCCC 
GAACAGCCCC 
GAACAACCCC 
GAACAACCCC 
GAACAACCCC 
GAACAGACCC 
ACATTGCTCC 



300 

TAACTCCACC 
CCTTTGACTG 
CTCTTGACTG 
CT . TTGACTG 
CT . TTGACTG 
CT . TTGACTG 
CT. TTGACTG 
CT. TTGACTG 
TAACCCAACC 

C 

C 

C 



HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 



H L31 
H HCM2 
H 19 
H MP 20 
H CM3 
H MC16 
H CM1 
H MP 2 3 
H H13 
H HI 
H HU8 
H PA7 



HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 



HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 
HERV-H 



1.31 

HCM2 

19 

MP20 

CM3 

MC16 

CM1 

MP23 

H13 

HI 

HU8 

PA7 



L31 

HCM2 

19 

MP20 

CM3 

MCI 6 

CM1 

MP23 

H13 

HI 

HU8 

PA7 



301 

GCCTGTCCCA 
TAATTTTCCA 
TAATTTTCCT 
TAATTTTCCT 
TAATTTTCCA 
TAATTTTCCA 
TAATTTTCCA 
TAATTTTCCA 
GCCTA.CCCC 
ACCTATCCC . 
ACCTATCCC . 
ACCTATCCC . 

351 

CACTTTGCTG 
CCCTTTGCTG 
CCCTTCGCTG 
CCCTTGGCTG 
CCCTTCGCTG 
CCCTTCCCTG 
CCCTTCGCTG 
CCCTTCGCTG 
CCCTTTGCTG 
CCCTTTGCTG 
CCCTTTGCTG 
CCCTTTGCTG 

401 

AAATAAACAG 
AAATAAACAG 
AAATAAACAG 
AAATAAACAG 
AAATAAACAG 
AAATAAACAG 
AAATAAACAG 
AAATAAACAG 
AAATAAACAG 
AAATAAACAG 
AAATAAACAG 
AAATAAACAG 



AAACCTATGA 
TTACCTTCCC 
TTACCTACCT 
TTATCTACCC 
TTACTTTCCC 
CTGCCCGCCC 
TTACCTTCCC 
TTACCTTCCC 
AAACCTGTAA 
AAACCTATAA 
AAACCTATAA 
AAACCTATAA 



ACTCTCTTTC 
ACTCTCTTTT 
ACTCTCTTTT 
ACTCTCTTTT 
ACTCTCTTTT 
ACTCTCTTTT 
ACTCTCTTTT 
ACTCTCTTTT 
ACTC. . TTTT 
ACTCTCTTTT 
ACTCTCTTTT 
ACTCTCTTTT 



CCATGTTGCT 
CCATGTTGCT 
CCATGTTGCT 
CCATGTTGCT 
CCATGTTGCT 
CCATGTTGCT 
CCATGTTGCT 
CCATGTTGCT 
CCATGTTGCT 
CCATGTTGCT 
CCATGTTGCT 
CCATGTTGCT 



GAA . CTAATG 
TAATCCTATA 
AAATCCTATA 
AAATCCTATA 
AAATCCTATA 
AAACCCTATA 
AAATCCTATA 
AAATCCTATA 
GAA. CTAATG 
GAA. CTAATG 
GAA . CTAATG 
GAA. CTAATG 



C. 
C. 
C. 

c. 
c. 



. AGACTC 
. GGACTC 
. GGACTC 
.GGACTC 
.GGACTC 



CTTCGGACTC 



.GGACTC 
.GGACTC 
. AGAATC 
.GGACTC 
.GGACTC 
.GGACTC 



ATA 

AAACGGCCCC 
AAATGGCCCC 
AAACAGCCCC 
AAACGGCCCC 
AAACGGTCCC 
AAACGGCCCC 
AAACGGCCCC 

ATA 

ATA 

ATA 



AGCCCGGCTG 
AGCCCGCCTG 
AGCCCGCCTG 
AGCCCGCCTG 
AGCCCGCCTG 
AGCCCGCCTG 
AGCCCGCCTG 
AGCCCGCCTG 
AGCCCGCCTG 
AGCCCGCCTG 
AGCCCGCCTG 
AGCCCGCCTG 



350 

ATCCC.ACCA 
ACCCC.ATCT 
ACTCCTATCT 
ACCTTTATCT 
ACCCCTATCT 
ACCCC.ATCT 
ACCCCTATCT 
ACCCCTATCT 
.ATCC. .ACCA 
ATCCT.ACCA 
ATCC. .ACCA 
ATCCT.ACCA 

400 

CACCCAGGTG 
CACCCAGGTG 
TACCCAGGTG 
CACCCAGGTG 
CACCCAGGTG 
CACCCAGGTG 
CCCCCAGGTG 
CCCCCAGGTG 
CACCCAGGTG 
CACCCAGGTG 
CACCCAGGTG 
CACCCAGGTG 



425 
CACAT 
CACAT 
CACAT 
CACAT 
CACAT 
CACAT 
CACAT 
CACAT 
CACAT 
CACAT 
CACAT 
CACAT 
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B. HERV-W LTR sequences 



24/29 



HERV- 
HERV- 
HERV- 
HERV- 
HERV< 
HERV- 
HERV 
HERV* 
HERV 
HERV 
HERV 
HERV 
HERV 
HERV 



HERV- 
HERV* 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV 
HERV- 
HERV 
HERV 
HERV 



■T47D-W2 

•T47D-W4 

-T47D-W5 

-Wl 

•W10 

■Wll 

-W18 

•W2 

-W22 

-W23 

-W4 

-W5 

-W6 

-W8 



•T47D-W2 

•T47D-W4 

■T47D-W5 

■Wl 

•W10 

-Wll 

-W18 

-W2 

■W22 

-W23 

-W4 

-W5 

-W6 

-W8 



HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV' 
HERV' 
HERV 
HERV 



•T47D-W2 

■T47D-W4 

•T47D-W5 

■Wl 

-W10 

•Wll 

-W2 

-W22 

>W23 

-W4 

-W5 

-W6 

•W8 



TGTTGAGATG 
TGTTGAGATG 
TGTTGAGATG 
TGTTGAGATG 
TGTTGAGATG 
TGTTGAGATG 
TGTTGAGATG 
TGTTGAGATG 
TGTTGAGATG 
TGTTGAGATG 
TGTTGAGATG 
TGTTGAGATG 
TGTTGAGATG 
TGTTGAGATG 

51 

CTAAGAATCC 
CTAAGAATTC 
CTAAGAATCC 
CTAAGAATCC 
CTAAGAATCC 
CTAAGAATCC 
CTAAGAATCC 
CTAAGAATCC 
CTAAGAATCC 
CTAAGAATCC 
CTAAGAATCC 
CTAAGAATCT 
CTAAGAATCC 
TTAAGAATCC 

101 

ACGGGGCTCG 
ATGGGGCTTG 
ACAGGGCTTG 
ATGGGGCTTG 
ACGGGGCTTG 
ACGGGGCTTG 
ACGGGGCTTG 
ACTAGGCTTG 
ATGGGGCTTG 
ACTAGGCTTG 
ACGGGGCTTG 
ACAGGGCTTG 
ACTAGGCTTG 
ACGGGGCTTG 



GGGGACTGAG 
GGGGACTGAG 
GGGGACTGAG 
GGGGACTGAG 
GGGGACTGAG 
GGGGACTGAG 
GGGGACTGAG 
GGGGACTGAG 
GGGGACTGAG 
GGGGACTGAG 
GGGGACTGAG 
GGGGACTGAG 
GGGGACTGAG 
GGGGACTGAG 



CTAAGCCTAG 
CTAAGCCTAG 
CTAAGCCTAG 
CTAAGCCTAG 
CTAAGCCTAG 
CTAAGCCTAG 
CTAAGCCTAG 
CTAAGCCTAG 
CTAAGCCTAG 
CTAAGCCTAG 
CTAAGCCTAG 
CTAAGCCTAG 
CTAAGCCTAG 
CTAAGCCTAG 



CAACTTAGCT 
CAACTTAACT 
CAACTTAGCT 
CAACTTAGCT 
CAACTTAGCT 
CAATTTAGCT 
CAATTTAGCT 
CAACTTAGCT 
CAACTTAACT 
CAACTTAGCT 
CAATTTAGCT 
CAACTTAGCT 
CAACTTAGCT 
CAACTCAGCT 



AGACAGGACT 
AGACAGGACT 
AGACAGGACT 
AGACAGGACT 
AGACAGGACT 
AGACAGGACT 
AGACAGGACT 
AGACAGGACT 
AGACAGGACT 
AGACAGGACT 
AGACAGGACT 
AGACAGGACT 
AGACAGGACT 
AAACAGGACT 



CTGGGAAGGT 
CTGGGAAGGT 
CTGGGAAGGT 
CTGGGAAGGT 
CTGGGAAGGT 
CTGGGAAATT 
CTGGGAAATT 
CTGGGAAGGT 
CTGGGAAGGT 
CTGGGAAGGT 
CTGGGAAATT 
CTGGGAAGGT 
CTGGGAAGGT 
ATGGGAAGTT 



CACACCCAAC 
CATATCTGAC 
CACACTTGAC 
CACACCCAAC 
CATACCCAAC 
CACACCCGAC 
CACACCCGAC 
CACACCCGAC 
CATATCTGAC 
CACACCCGAC 
CACACCCGAC 
CACACCCGAC 
CACACCCGAC 
CACACCCGAC 



AGCTGGATTT 
AGCTGGATTT 
ACCTGGATTT 
AGCTGGATTT 
AGCTGGATTC 
AGTTGGATTT 
AGTTGGATTT 
AGCTGGATTT 
AGCTGGATTT 
AGCTGGATTT 
AGTTGGATTT 
ACCTGGATTT 
AGCTGGATTT 
AGCAGGATTT 



GACCGCATCC 
GACCGCATCC 
GACCACATCC 
GACTACACCC 
GACCACATCC 
GACCACGTCC 
GACCACGTCC 
GACTACACCC 
GACCGCATCC 
GACTACACCC 
GACCACGTCC 
GACCACATCC 
GACTACACCC 
GACCACATCC 



CAATCAGGTA 
CAATCAGGTA 
CAGTCAGGTA 
CAATCAGGTA 
AAATCAGGTA 
CAATCAGGTA 
CAATCAGGTA 
CAATCAGGTA 
CAATCAGGTA 
CAATCAGGTA 
CAATCAGGTA 
CCATCAGGTA 
CAATCAGGTA 
CCATCAGGTA 



50 

CCTAGGCCGA 
CCTAGGCCGA 
CCTAGGCCGA 
CCTAGGCCAA 
CCTAGGCCGA 
CCTAGGCTGG 
CCTAGGCCGG 
CCTAGGCCAA 
CCTAGGCTGA 
CCTAGGCTGA 
CCTAGGCTGG 
CCTAGGCCAA 
CCTAGGCCAA 
CCTAGGCCGA 

100 

ACCTTTAAAC 
ATCTTTAAAC 
ACCTTTAAAC 
ACCTTTAAAC 
ACCTTTAAAC 
ACCTTTAAAC 
ACCTTTAAAC 
ACCTTTAACC 
ATCTTTAAAC 
ACCTTTAACC 
ACCTTTAAAC 
ACCTTTAAAC 
ACCTTTAACC 
ACCTTTAAAC 

150 

GTAAAGAGGG 
GTAAAGAGAG 
GTAAAGAGAG 
GTAAAGAGAG 
GTAAAGAGAG 
GTAAAGGGAG 
GTAAAGGGAG 
GTAAAGAGAG 
GTAAAGAGAG 
GTAAAGAGAG 
GTAAAGGGAG 
AGAAAGAGAG 
GTAAAGAGAG 
AGAAAGAGAG 



HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV' 
HERV' 
HERV' 
HERV 
HERV 



T47D-W2 

■T47D-W4 

•T47D-W5 

•Wl 

-W10 

•Wll 

-W18 

•W2 

-W22 

-W23 

-W4 

-W5 

-W6 

-W8 



151 

CTCACTAAAA 
CTCACTAAAA 
CTCACTAAAA 
CTTGCTAAAA 
CTCACTAAAA 
CTCACTAAAA 
CTCACTAAAA 
CTTGCTAAAA 
CTTGCTAAAA 
CTTGCTAAAA 
CTCACTAAAA 
CCCGCTAAAA 
CTTGCTAAAA 
CCCGCTAAAA 



TGCTAATTAG 
TGCTAATTAG 
TGCTAATTAG 
TGCTAATTAG 
TACTGATTAG 
TGCTAATTAG 
TGCTAATTAG 
TGCTAATTAG 
TGCTAATTAG 
TGCTAATTAG 
TGCTAATTAG 
TGCTAATTAG 
TGCTAATTAG 
TGCTAATTAG 



GCAAAGACAG 
GCTAAAACAG 
GCTAAAACAG 
GCAAAAACAG 
GCGAAAACAG 
GGAAAAACAG 
GGAAAAACAG 
GCAAAAACAG 
GCAAAAACAG 
GCAAAAACAG 
GGAAAAACAG 
GCAAAAACAG 
GCAAAAACAG 
GCAAAAACAG 



GAGGTAAAGA 
GAGGCAAAGA 
GAGGTAAAGA 
GAGGTAAAGA 
GAGGTAAGGA 
GAGGTAAAGA 
GAGGTAAAGA 
GAGGTAGAGA 
GAGGTAAAGA 
GAGGTAAAGA 
GAGGTAAAGA 
GAGGTAAAGA 
GAGGTAAAGA 
GAGGTAAAGA 



200 

AATAGCCAAT 
AGTAGCCAAT 
AATAGACAAT 
AATAGCCAGT 
AACAGCCAGT 
AGTAGCCAAT 
AGTAGCCAAT 
AATAGCCAAT 
AATAGCCAGT 
AATAGCCAGT 
AGTAGCCAAT 
AATAGTCAAT 
AATAGCCAGT 
AATAGCCAAT 
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HERV 
HKKV 
HERV 
HKKV- 
HERV- 
HERV- 
HERV- 
HERV 
HERV 
HERV 
HERV 
HERV 
HERV 
HERV 



HERV- 
HERV- 
HERV- 
HERV- 
HERV- 
HERV' 
HERV 
HERV 
HERV 
HERV 
HERV 
HERV 
HERV 
HERV 



HERV- 
HERV- 
HERV- 
HERV' 
HERV- 
HERV- 
HERV* 
HERV 
HERV- 
HERV 
HERV 
HERV 
HERV 
HERV 



-T47D-W2 

-T47D-W4 

•T47D-W5 

■Wl 

•W10 

-Wll 

-W18 

-W2 

-W22 

-W23 

-W4 

-W5 

-W6 

-W8 



-T47D-W2 

■T47D-W4 

-T47D-W5 

■Wl 

■W10 

•Wll 

-W18 

-W2 

-W22 

-W23 

>W4 

-W5 

-W6 

-W8 



■T47D-W2 

•T47D-W4 

■T47D-W5 

■Wl 

■W10 

-Wll 

•W18 

-W2 

■W22 

-W23 

-W4 

-W5 

-W6 

-W8 



201 

CATCTATTGC 
CATCTGTTGC 
CATCTATCAC 
CATCTATCGC 
CATCTATCGC 
CATCTATCGC 
CATCTATCGC 
CATCTATCGC 
CATCTATCGC 
CATCTATCGC 
CATCTATCGC 
CATCTATTGC 
CATCTATCGC 
CATCTATTGC 

251 

CCAAGTCTTC 
CCAGGCATTC 
CCAGGCATTC 
TCAGGCATTC 
TCAGGCATTC 
CCAGGCATTC 
CCAGGCATTC 
CCAAGCATTC 
TCAGGCATTC 
TCAGGCATTC 
CCAGGCATTC 
CCAGGCATTC 
TCAGGCATTC 
CCAGGCATTC 

301 

TATGGGAGCT 
TATGGGAGCT 

AGCT 

TATGGGAGCT 
TATGGGAGCT 
TATGGGAGCC 
TATGGAAGCT 
TATGGGAGCT 
TATGGGAGCT 
TATGGGAGCT 
TATGGAAGCT 
TATGGGAGCT 
TATGGGAGCT 
TATGGGAGCT 



CTGAGAGCAC 
CTGACAGCAC 
CTGAGAGCAC 
CTGACAGCAC 
CTGACAGCAC 
CTGAGAGCAC 
CTGAGAGCAC 
CTGAGAGCAC 
CTGACAGCAC 
CTGACAGCAC 
CTGAGAGCAC 
CTGAGAGCAC 
CTGACAGCAC 
CTGAGAGCAC 



GAGCCGGCAA 
GAGCCAGCTA 
GAGCCAGCAA 
AAGCCAGCAA 
AAGCCAGCAA 
AAGCCAGCGG 
AAGCCAGCGG 
GAGCCAGCAA 
AAGCCAGCAA 
AAGCCAGCAA 
AAGCCAGCGG 
GAGCCGGCAA 
AAGCCAGCAA 
GAGCCGGCAA 



CTGTTTTCAC 
CTGTCTTCAC 
CTGTTTTCAC 
CTGTTTTCAC 
CTGTTTTCAC 
CTGTTTTCAC 
CTGTTTTCAC 
CTATTTTCAC 
CTGTTTTCAC 
CTGTTTTCAC 
CTGTTTTCAC 
CTGTTTTCAC 
CTGTTTTCAC 
CTGTTTTCAC 



25/29 

AGCAGGAGGG 
AGCAGGAGGG 
AGTGGGAGGG 
AAGGGGCGGG 
AAGGGGCGGG 
AACAGGAGGG 
AACAGGAGGG 
AGCAGGAGGG 
AAGGGGCGGG 
AAGGGGCGGG 
AACAGGAGGG 
AGCGGGAGGG 
AAGGGGCGGG 
AGCGGGAGGG 



TGGCTACCTT 
CAGCTACCCT 
CAGCAACCCC 
TGGCTACCCA 
TGGCTACCCA 
TGGCTACCCT 
TGGCTACCCT 
TGGCTACCCT 
TGGCTACCCA 
TGGCTACCCA 
TGGCTACCCT 
CGACTACCCT 
TGGCTACCCA 
CGACTACCCT 



TCTATTAAAT 
TCTATTAAAT 
TCTATTAAAT 
TCTATTAAAT 
TCTATTAAAT 
TCTATTAAAT 
TCTATTAAAT 
TCTATTAAAT 
TCTATTAAAT 
TCTATTAAAT 
TCTATTAAAT 
TCTATTAAAT 
TCTATTAAAT 
TCTATTAAAT 



ACAATGATCG 
ACAATGATCG 
ACAATGATCG 
ACAATGATCA 
ACAATGATCA 
ACAATGATCA 
ACAATGATCA 
ACAATGATCG 
ACAATGATCA 
ACAATGATCA 
ACAATGATCA 
ACAATGATCA 
ACAATGATCA 
ACAATGATCA 



CTTTGGGTCC 

CTTTGGGTCC 

CTTTGGG. . . 

CTTTGGGTCC 

CTTTGGGTCC 

CTTTGGGTCC 

CTTTGGGTCC 

CTTTGTGTCC 

CTTTGGGTCC 

CTTTGGGTCC 

CTTTGGGTCC 

CTTTGGGTCC 

CTTTGGGTCC 

CTTTGGGTCC 



CTTGCAACTG 
CTTGCAACTG 
CTTGCAACTG 
CTTGCAACTG 
CTTGCAACTG 
CTTGCAACTG 
CTTGCAACTG 
CTTGCAACTG 
CTTGCAACTG 
CTTGCAACTG 
CTTGCAACTG 
CTTGCAACTG 
CTTGCAACTG 
CTTGCAACTG 



250 

GGATATAAAC 
GGATATAAAC 
GCATA TAAAC 
GGATATAAAC 
GGATATAAAC 
GGATATAAAC 
GGATATAAAC 
GGATATAAAC 
GGATATAAAC 
GGATATAAAC 
GGATATAAAC 
GGATATAAAC 
GGATATAAAC 
GGATATAAAC 

300 

CCTCCCTTTG 
CCTCCCTTTG 

CCTCCCATTT 
CCTCCCATTT 
CCTCCCTTTG 
CCTCCCTTTG 
CCTCCCTTTG 
CCTCCCATTT 
CCTCCCATTT 
CCTCCCTTTG 
CCTCCCTTTG 
CCTCCCATTT 
CCTCCCTTTG 

343 
C. . 

c. . 
c. . 

CAA 
CAA 
CAA 
CAA 
CAA 

CAA 

CAA 

CAA 

CAA 

CAA 

CAA 
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C. HERV-K LTR sequences 



HERV-K45 

HERV-K27 

HERV-K2 

HERV-K1 

HERV-K30 

HERV-K10 



HERV-K45 

HERV-K27 

HERV-K2 

HERV-K1 

HERV-K30 

HERV-K10 



HERV-K45 

HERV-K27 

HERV-K2 

HERV-K 1 

HERV-K30 

HERV-K10 



HERV-K45 

HERV-K27 

EERV-K2 

HERV-K1 

HERV-K30 

HERV-K10 



HERV-K45 

HERV-K27 

HERV-K2 

HERV-K1 

HERV-K30 

HERV-K10 



HERV-K45 

HERV-K27 

HERV-K2 

HERV-Kl 

HERV-K30 

HERV-K10 



HERV-K45 

HERV-K27 

ESRV-K2 

HERV-Kl 

HERV-K30 

HERV-K10 



HERV-K45 

HERV-K27 

HERV-K2 

HERV-K 1 

HERV-R30 

HERV-K10 



GCGACCGGT: GGATC ; CCGG GCCCGCGG:T ACCGTCGACT 

GCGACCGGT: GGATC: CCGG GCCCGCGG:T ACCGTCGACT 

GCGACCGGT: GGATC: CCGG GCCCGCGG:T ACCGTCGACT 

GCGACCGGT: GGATC: CCGG GCCCGCGG:T ACCGTCGACT 



50 

: GCAGAATTC 
: GCAGAATTC 
: GCAGAATTC 
: GCAGAATTC 



GTC CCACCTCCAG CCCTAAGGCG GTTTTTCCCT ATCTCAGTAG 

AGTAG 



51 

ATGGAGCATA 
ATGGAGCATA 
ATGGAGCATA 
ATGGAGCATA 
ATGGAGCATA 
ATGGAGCATA 



CAATCGGGTT 
CAATCGGGTT 
CAATCGGGTT 
CAATCGGGTT 
CAATCGGGTT 
CAATCGGGTT 



TTATACCGAG 
TTATACCGAG 
TTATACCGAG 
TTATACCGAG 
TTATACCGAG 
TTATACCGAG 



ACATTCCATT 
ACATTCCATT 
ACATTCCATT 
ACATTCCATT 
ACATTCCATT 
ACATTCCATT 



100 

GCCCAGGGAC 
GCCCAGGGAC 
GCCCAGGGAC 
GCCCAGGGAC 
GCCCAGGGAC 
GCCCAGGGAC 



101 

AGGCAGGAGA 
AGGCAGGAGA 
AGGCAGGAGA 
AGGCAGGAGA 
AGGCAGGAGA 
AGGCAGGAGA 



CAGATGCCTT 
CAGATGCCTT 
CAGATGCCTT 
CAGATGCCTT 
CAGATGCCTT 
CAGATGCCTT 



CCTCTTGTCT 
CCTCTTGTCT 
CCTCTTGTCT 
CCTCTTGTCT 
CCTCTTGTCT 
CCTCTTGTCT 



CAACTGCAAG 
CAACTGCAAG 
CAACTGCAAG 
CAACTGCAAG 
CAACTGCAAG 
CAACTGCAAG 



150 

AGGCATTCCT 
AGGCATTCCT 
AGGCATTCCT 
AGGCATTCCT 
AGGCATTCCT 
AGGCATTCCT 



151 

TCCTCTTATA 
TCCTCTTATA 
TCCTCTTATA 
TCCTCTTATA 
TCCTCTTATA 
TCCTCTTTTA 



CTAATCCTCC 
CTAATCCTCC 
CTAATCCTCC 
CTAATCCTCC 
CTAATCCTCC 
CTAATCCTCC 



TCAGCACAGA 
TCAGCACAGA 
TCAGCACAGA 
TCAGCACAGA 
TCAGCACAGA 
TCAGCACAGA 



CCCTTTACGG 
CCCTTTACGG 
CCCTTTACGG 
CCCTTTACGG 
CCCTTTACGG 
CCCTTTACAG 



200 

GTGTCGGGCT 
GTGTCGGGCT 
GTGTCGGGCT 
GTGTCGGGCT 
GTGTCGGGCT 
GTGTCGGGCT 



201 

GGGGGACGGT 
GGGGGACGGT 
GGGGGATGGT 
GGGGGACGGT 
GGGGGACGGT 
GGGGGACGGT 



CAGGTCTTTC 
CAGGTCTTTC 
CAGGTCTTTC 
CAGGTCTTTC 
CAGGTCTTTC 
CAGGTCTTTC 



CCTTCCCACG 
CCTTCCCACG 
CCTTCCCACG 
CCTTCCCACG 
CCTTCCCACG 
CCTTCCCACG 



AGGCCATATT 
AGGCCATATT 
AGGCCATATT 
AGGCCATATT 
AGGCCATATT 
AGGCCATATT 



250 

TCAGACTATC 
TCAGACTATC 
TCAGACTATC 
TCAGACTATC 
TCAGACTATC 
TCAGACTATC 



251 

ACATGGGGAG 
ACATGGGGAG 
ACATGGGAAG 
ACATGGGGAG 
ACATGGGGAG 
ACATGGGGAG 



AAACCTTGGA 
AAACCTTGGA 
AAACCTTGGA 
AAACCTTGGA 
AAACCTTGGA 
AAACCTTGGA 



CAATACCTGG 
CAATACCTGG 
CAATACCTGG 
CAATACCTGG 
CAATACCTGG 
CAATACCTGG 



CTTTCCTAGG 
CTTTCCTAGG 
CTTTCCTAGG 
CTTTCCTAGG 
CTTTCCTAGG 
CTTTCCTAGG 



300 

CAGAGGTCCC 
CAGAGGTCCC 
CAGAGGTCCC 
CAGAGGTCCC 
CAGAGGTCCC 
CAGAGGTCCC 



301 

TGCGGCCTTC 
TGCGGCCTTC 
TGCGGCCTTC 
TGCGGCCTTC 
TGCGGCCTTC 
TGCGGCCTTC 



CGCAGTTTTT 
CGCAGTTTTT 
CGCAGTTTTT 
CGCAGTTTTT 
CGCAGTTTTT 
TGCAGTTTTT 



GTGT : CCTGG 
GTGT : CCTGG 
GTGT : CCTGG 
GTGT : CCTGG 
GTGTCC : TGG 
GTGTCCCTGG 



GTACTTGAGA 
GTACTTGAGA 
GTACTTGAGA 
GTACTTGAGA 
GTACTTGAGA 
GTACTTGAGA 



350 

TTAGGGAGTG 
TTAGGGAGTG 
TTAGGGAGTG 
TTAGGGAGTG 
TTAGGGAGTG 
TTAGGGAGTG 



351 

GTGATGACTC 
GTGATGACTC 
GTGATGACTC 
GTGATGACTC 
GTGATGACTC 
GTGATGACTC 



TTAAGGAGCA 
TTAAGGAGCA 
TTAAGGAGCA 
TTAAGGAGCA 
TTAAGGAGCA 
TTAAGGAGCA 



TGCTGCCTTC 
TGCTGCCTTC 
TGCTGCCTTC 
TGCTGCCTTC 
TGCTGCCTTC 
TGCTGCCTTC 



AAGCATCTGT 
AAGCATCTGT 
AAGCATCTGT 
AAGCATCTGT 
AAGCATCTGT 
AAGCATCTGT 



400 

TTAACAAAGC 
TTAACAAAGC 
TTAACAAAGC 
TTAACAAAGC 
TTAACAAGGC 
TTAACAAAGC 
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HERV-K45 

HERV-K27 

HERV-K2 

HERV-K1 

HERV-K30 

HERV-K10 



401 

ACATCCTGCA 
ACATCCTGCA 
ACATCCTGCA 
ACATCCTGCA 
ACATCCTGCA 
ACATCCTGCA 



CCGCCCTTAA 
CCGCCCTTAA 
CTGCCCTTAA 
CCGCCCTTAA 
CCGCCCTTAA 
CCGCCCTTAA 



TCCATTCAAC 
TCCATTCAAC 
TCCATTCAAC 
TCCATTCAAC 
TCCATTCAAC 
TCCATTCAAC 



CCTGAGTTGA 
CCTGAGTTGA 
CCTGAGTTGA 
CCTGAGTTGA 
CCTGAGTTGA 
CCTGAGTTGA 



450 

CACAGCACAC 
CACAGCACAC 
CACAGCGCAC 
CACAGCACAC 
CACAGCACAC 
CACAGCACAT 



HERV-K45 

HERV-K27 

HERV-K2 

HERV-K1 

HERV-K30 

HERV-K10 



451 

GTTTCAGAGA 
GTTTCAGAGA 
GTTTCAGAGA 
GTTTCAGAGA 
GTTTCAGAGA 
GTTTCAGAGA 



GCACGGGGTT 
GCACGGGGTT 
GCACGGGGTT 
GCACGGGGTT 
GCACGGGGTT 
GCACGGGGTT 



GGGGGTAAGG 
GGGGGTAAGG 
GGGGGTAAGG 
GGGGGTAAGG 
GGGGGTAAGG 
GGGGGTAAGG 



TCATAGATTA 
TCATAGATTA 
TCATAGATTA 
TCATAGATTA 
TCATAGATTA 
TCATAGATTA 



550 

ACAGAATCTC 
ACAGAATCTC 
ACAGAATCTC 
ACAGAATCTC 
ACAGAATCTC 
ACAGAATCTC 



HERV-K45 

HERV-K27 

HERV-K2 

HERV-K1 

HERV-K30 

HERV-K10 



501 

AAGGCAGAAG 
AAGGCAGAAG 
AAGGCAGAAG 
AAGGCAGAAG 
AAGGCAGAAG 
AAGGCAGAAG 



AATTTTTCTT 
AATTTTTCTT 
AATTTTTCTT 
AATTTTTCTT 
AATTTTTCTT 
AATTTTTCTT 



AACACATAAC 
AACACATAAC 
AACACATAAC 
AACACATAAC 
AACACATAAC 
AGCACATAAC 



AAAATGGAGT 
AAAATGGAGT 
AAAATGGAGT 
AAAATGGAGT 
AAAATGGAGT 
AAAATGGAGT 



550 

CTCCCATGTC 
CTCCCATGTC 
CTCCCATGTC 
CTCCCATGTC 
CTCCCATGTC 
CTCCTATGTC 



HERV-K45 

HERV-K27 

HERV-K2 

HERV-K1 

HERV-K30 

HERV-K10 



551 

TACTTCTTTC 
TACTTCTTTC 
TACTTCTTTC 
TACTTCTTTC 
TACTTCTTTC 
TACTTCTTTC 



TACACAGACA 
TACACAGACA 
TACACAGACA 
TACACAGACA 
TACACAGACA 
TACACAGACA 



CAGTAACAAT 
CAGTAACAAT 
CAGTAACAAT 
CAGTAACAAT 
CAGTAACAAT 
CAGTAACAAT 



CTGATCTCTC 
CTGATCTCTC 
CTGATCTCTC 
CTGATCTCTC 
CTGATCCCTC 
TTGATCTCTC 



600 

TTGCTTTTCC 
TTGCTTTTCC 
TTGCTTTTCC 
TTGCTTTTCC 
TTGCTTTTCC 
TTGCTTTTCC 



601 650 

HERV-K45 CCACATTTCC CCCTTTTCTT TTCG 

HERV-K27 CCACATTTCC CCQTTTTCTT TTCGA 

HERV-K2 CCACATTTCC CCCTTTTCTT TTCGACAAA 

HERV-K1 CCACATTTCC CCCTTTTCTT TTCGACAAAA CCGCCAT:CT CGAGATC : TG 

HERV-K30 CCACATTTCC CCCTTTTCTT ATCCATCACA CTGGCGGCCG CTCGAGCATG 

HERV-K10 CCACATTTCC CCCTTTTCTT TTCGACAAAA CCGCCATC 



651 

HERV-K1 AGT 

HERV-K30 CATCTAGAGG GCCCAATTCG CCCTATAGTG 
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HERV-K-T47D-5 'LTR 

TGTGGGCGAAGGATTACCCAGGTGCCGAGGCAAGAGACTGAAGGCACAAACTGTTTCAGTATAATATAGAAAATAGCTAG 
AATAAGAATAGTTATAATAAAAATTAGATATACACATGATCATGGACATTACCAATCATTACTACAAACATTGTTAATCA 
TTAGCTTTTAATATTACTCTTTGTTTTATTACTAATATAACCAAGGAATAACCGGTAGCATACGGTCAGGTGCTGAAGGG 
ACATTGTGAGAAGTGACCTAGAAGGCAAGAGGTGAGCCTTCTGTCACGCCTGCATAAGGACAGCTTGAGGGCTCCTTGGT 
CAAGCTGTAACACCAGTGCCTGGGAAGGCACCGTTACTTAGCAGACCATGAAAGGGAGTCTCCATTCCTTGGAGGAGTCA 
GGGAAACACTATGCTCCACCAGCTTCTTGTGTATCCAGCCCTGCCCACAGTCATCCAGAGGCATAAACCCCTCCCTGTGG 
TGCTGTGCTTCAATGGCCATGCTTCTTGTCCACTTTCATGTTCCTCCTGTACTCCTGGTTCCTCTTTGAAGTTCGTAGAA 
GATAATGGTAGAAGAAATAGTGAAAGTCTTTGATCTTTCTTATAAGTGCATAGAAGAAAACACTGATGTATGCCTGCCTT 
CCCTCTCTGCTTCAGCTACCTAAAAGGAAAGGCCCCCTTTCCCATGATCACATGACTTGCCTGACCTTATCAATCACTTG 
GAGGACTCACCCTCCTTACCCTGTCCCTTTGTCTTGTATGCAATAAATATCAGCACGCCCAGCCATTCGGGGCCACTACT 
GGTCTCCGCAACTTGGTGGTAGTGGTACCCTGGGCCCAGCTGTTTTCTCTTTATCTCTTTTGTCTTGTGTCTTTATTTCT 
TACAATCTCTCATCTCTGCACATGGGGAGAACACCGGCAAAGCCCGTAGGGCTGGACCTTACA 



Ii48-LTR (TJ3-R) 

TGTGGGCGGAAGAGTACCTAGGTGCCGAGGCAAGAGACTGAAGGCACAAACTGTTTCAGTATAATAAAGAAAATAGAATA 
AGAATAGTCATAATACAAATTAGATACAGCGATGATCATGAACAATTATCCATCATTATTATAAACATTATTAATCATTA 
GCTTTTAATATTACTCTGTTGCATTAATAATATAACCTAGGAATAACCGGCAGGTATAGGGTCAGGTGCTGAAGGGACAT 
TGTGAGAAGTGAATAGAAGGCAAGAGGGGAGCCTTCTGTCATGCCCGCATAAGGGCCGCTTGAGGGCCCCTTGGTCAAGC 
GGTAACGCCAGTGTCTGGGAAGGCACCCGTTACTGAGCAGACCGGGAAAGGGAGTCTCCTTTCCTTGGAGGAGTCAGGGA 
ACGCTCTGCTCCACCAGCTTCTTGTGGGAGGCTGGATGTTACCCAGGCCTGCCTGCAGTCATCCGGAGGCCTGAACCCCT 
CCCTGTGGTGCTTCAATGGTCACGTTCCTTGTCCACTTTCATGCTCCTTCCGTACTCCTGGTTCCTCTTTGAAGTTCGTA 
GTAGATAGCGGTAGAAGAAATAGTGAAAGTCTTAAAGTCTTTGATCTTATAAGTTCATAGAAGAAAACGCTGATGCCTGC 
CGCCTTCTCTCTCTGCTTCAGCTACCTAAGAGGGAAGGGCCCGCTGTCCTGTGATCAGGTGACTTGCTTCACCTTGTCAA 
TCACTTAGAAGACTGACCCTCCTTATCCTGCCCCCTTGTCTTGTATGCAATAAATATCAGCGAGCCCAGCCGTTCAGGGC 
CACTACCGGTCTCCGTGTCTTTGTGGTAGTGGTCCCCGGGCCCAGCTGTTTTCTCTTT 



Ii5-LTR (TX3-R) 

TGTGGGTGGAGGATTACCCAGGTGCCAAGGCIAAGAGACTGAAGGCACAAACTGTTTCAGTATAATAAAAAAAATAGAATA 
AGAATAGTCATAATACAAATTAGATATAGAGATGATCATGGACAATTAGGAATCACT 

ACTCTTTGTTGCATTACTAATATAACCTAGGAATAACCGGTGGGTATAGGGTCAGGTGCTGAAGGGACATTGTGTGAAGT 
GACCTGGAAGGCAAGAGGTGAGCCCTCTGTCACGCCCACATAAGGGCCGCTTGAGGGCTCCTTGGTCAAGTGGTAACGCC 
AGTGTCTGGGAATGCACCCGTTAATTAGCAGACCGCGAAAGGGAGTCTCCTTTCCTTGGAAGAGTTGGGGAACACTCTGC 
TCCACCAGCTTCTTGTGGAAGGCTGGATATTATCCAGGCCTGCGCGCAGTCATCCGGAGGCTTAAACCCTTCCCTGTGGT 
GCTGTGCTTCAATGGTCCCACTCCTTGTCCACTTTCATGCTCCTCCCGTACTCCTGGTTCCTCTTTGAAGAGCGCAGTAG 
ATAGCGGTAGAAGAAATAGTGAAAGTCTTAAAGTCTTCGATCTTTCTTACAAGTGCAGAGAAGAAAACGCTGACATATGC 
TGCCTTCCCTCTCTGCTTCGGCTACCTAAAAGGGAAGGGCCGCCTATCCTGTAATCACATGACTTGCTTCACCTTGTCAA 
TCACTTAGAAGATTCACTCTCCTTACCCTGCCCCCTTGTCTTGTATGCAATAAATATCAGTGACCCCAGCCGTTCAGGGC 
CACTACTGGTCTCCGCGTCTTGATGGTAGTGGTCACCCCGGCCC 



L50-LTR (TX3-R) 

TGTGGGTGGAGGATTACCCAGGTGCCAAGGCAAGAGACTGAAGGCACAAACTGTTTCAGTATAATAAAAAAAATAGAATA 
AGAATAGTCATAATACAAATTAGATATAGAGATGATCATGGACAATTAGCAATCACTATTAATCTTTAGCTTTTAATATT 
ACTCTTTGTTGCATTACTAATATAACCTAGGAATAACCGGTGGGTATAGGGTCAGGTGCTGAAGGGACATTGTGAGAAGT 
GACCTGGAAGGCAAGAGGTGAGCCCTCTGTCACGCCCACATAAGGGCCGCTTGAGGGCTCCTTGGTCAAGTGGTAACGCC 
AGTGTCTGGGAATGCACCCGTTAATTAGCAGACCGCGAAAGGGAGTCTCCTTTCCTTGGAAGAGTTGGGGAACACTCTGC 
TCCACCAGCTTCTTGTGGAAGGCTGGATATTATCCAGGCCTGCGCGCAGTCATCCGGAGGCTTAAACCCTTCCCTGTGGT 
GCTGTGCTTCAATGGTCCCACTCCTTGTCCACTTTCATGCTCCTCCCGTACTCCTGGTTCCTCTTTGAAGAGCGCAGTAG 
ATAGCGGTAGAAGAAATAGTGAAAGTCTTAAAGTCTTCGATCTTTCTTACAAGTGCAGAGAAGAAAACGCTGACATATGC 
TGCCTTCCCTCTCTGCTTCGGCTACCTAAAAGGGAAGGGCCGCCTATCCTGTAATCACATGACTTGCTTCACCTTGTCAA 
TCACTTAGAAGATTCACCCTCCTTACCCTGCCCCCTTGTCTTGTATGCAATAAATATCAGTGACCCCAGCCGTTCAGGGC 
CACTACTGGTCTCCGCGTCTTGATGGTAGTGGTCACCCCGGCCCAGGTGTTTTTTCTTT 
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L9-LTR (966 at) 

TGTGGGTGGAGGATTACCCAGGTGCCGAGGCAAGAGACTGAAGGCACAAACTGTTTCAGTATAATAAAGAAAATGGTTAG 
AATAAGAATAGTCATAATACAAATTAGATATAGAGATGATCATGGACAATTATCAATCATTATTATAAACATTATTAATC 
ATTAGCTTTTAATATTACTCTTTGTTGCATTACTAATATAACCTAGGAATAACCGGTGGGTATAGGGTCAGGTGCTGAAA 
GGACATTGGGAGAAGTGACCTAGAAGGCAAGAGGTGAGTCTTCTGTCACGCCCGCATAAGGGTTGCTTGAGGGCTCCTTG 
GTCAAGTGGTAACGCCGGTGTCTGGGAAGGCACCTGTTACTTAGCCGACCACGAAAGGGAGTCTCCTTTCCTTGGAGGAG 
TCAGGGCGCACTCTGCTCCACCAGCTTCTTGTGGAAGGCTGGATATTATCCAGGCCTGCCCGCAGTCATCCGGAGGCCTA 
AACCCCTCCCTGTGGTGCTGTGCTTCAATGGGCACACTCCTCGTCCACTTTCATGTTCCTCCCATACTCCTGGTTTCTCT 
TTGAAGTTCGTAGTAGATAGTGGTAGAAGGAATAGGGAAAATCTTAAAGTGTTTGATCTTTCTTATAAGTGCATAGAAGA 
AAACGCTGACATATGCTGCCTTCTCTGTCTGCTTCAGCTACCTAAGAGGGAAGGGCCCCCTGTCCAGTGATCACGTGACT 
TGCTTCACCTTGTCAATCACTTAGAAGATTCACCCTCCTTACCCTGCCCCCTTGTCTTGTATGCAATAAATATCAGTGCA 
CCCAGCCTTTCGGGGCCACTTACCGGTCTCCACGTCTTGGTGGTAGTGGTCCCCCGGGCCCAGCTGTTTTCTCTTTATCT 
CTTTGTCTTGTGTCTTATTTATTACAATCTCTCGTCTCCGCACACAGGGAGAACACCCGCTAAGCTCCGTAGGGCTGGAC 
CCTACA 

L8-LTR (938 nt) 

TGTGGGTGGAGGATTACCCAGGTGCCGAGGCAAGAGACTGAAGGCACAAACTGTTTCAGTATAATAAAGAAAATGGTTAG 

AATAAGAATAGTCATAATACAAATTAGATATAGAGATGATCATGGACAATTATCAATCATTATTATAAACATTATO 

ATTAGCTTTTAATATTACTCTTTGTTGCATTACTAATATAACCTAGGAATAACCGGTGGGTATAGGGTCAGGTGCTGAAG 

GGACATTGGGAGAAGTGACCTAGAAGGCAAGAGGTGAGTCTTCTGTCACGCCCGCATAAGGGTTGCTTGAGGGCTCCTTG 

GTCAAGTGGTAACGCCGGTGTCTGGGAAGGCACCTGTTACTTAGCCGACCACGAAAGGGAGTCTCCTTTCCTTGGAGGAG 

TCAGGGCACACTCTGCTCCACCAGCTTCTTGTGGAAGGCTGGATATTATCCAGGCCTGCCCGCAGTCATCCGGAGGCCTA 

AACCCCTCCCTGTGGTGCTGTGCTTCAATGGGCACACTCCTCGTCCACTTTCATGTTCCTCCCATACTCCTG 

TTGAAGTTCGTAGTAGATAGTGGTAGAAGGAATAGGGAAAATCTTAAAGTGTTTC 

AAACGCTGACATATGCrit3CCTTCTCTGTCTGCTTCAGCTACCTAAGAGGGAAGGGCCCCCTGTCCAGTGATCACGTGACT 
TGCTTCACCTTGTCAATCACTTAGAAGATTCACCCTCCTTACCCTGCCCCCTTGTCTTGTATGCAATAAATATCAGTGCA 
CCCAGCCTTTCGGKKCACTTACCGGTCTCCACGTCTTGGTGGTAGTGGTCCCCCGGCCCAGCTGTTTTCTCTTTATCTCT 
TTGTCTTGTGTCTTATTTATTACAATCTCTCGTCTCCGCACACAGGGAGAACACCCGC (Abbruch 26 nt vor 
Ende der LTR) 



L49-LTR o L20-LTR (963 nt) 

tgtgggcgaaagattacctaggtgccgaggcaagagactgaaggcacaaactgtttcagtataataaagaaaatagttaa 
aataagaatagttataatacaaattagatatagagatgatcatggacaattatcaatcattattataaacattaatcatt 
agcttttaatattactctttgttgctttactaatataacctaggaataaccggtgggtatagggtcaggtgttgacggga 
tattgtgagaagtgacctagaaggcaagaggtgagccttctgtcacgcccacataagggccgcttgagggctctttggtc 
aagtggtaacgccagtgtctgtgaaggcacctgttacttagcagaccgcgaaagggagtctcctttccttggaggagtca 
gggaacactctgctccaccagcttcttgtggaaggctggatattatctaggcctgcccgcagtcatctggaggcctaaac 
ccctccctgtggtgctgtgcttcagtggtcactctccttgtccactttcatgttcctcccgtactcctggttcctctttg 
aagttcgtagtagatagcagtagaagaaatagtgaaagtcttaaagt^^ 

cgctgacatatgctgccttctctatctctgcggtggctacctaaaagggaagggccccctgtcccatgatcatgtgactt 
gcttcaccttatcacttagaagattcatcctccttaccctgcgccccctcgtcttgtatgcaataaatatcagcacgccc 
agtcgtttgaggccactgccggtctccgcgtcttggtggtagtggtcccccgggcccagctattgtctctttatctcttt 
gtcttgtgtctttatttattacaatctcttgtctctgcacacagggagaacacctgctaagccccgtaggactggaccct 

ACA 



HERV-IP-T47D 

TGTTCAATTCTTTGCCTTCTACTTTTAAACTTAACTTCCTCATAAAGCAACCTTTTTCAATCACCTC 

CATTCTGATCACCTGCTCCACCCTGACTCATTCCGATCACCTGATCCACTGTGACTCATTCCGATTACCCGCTCCACCCT 

GACTCATTCTGATTCTGATTTCCTGCTCTGCCATAACCATTTTTCCCGCCAAACCACTCACCCTGTCACTCTCTTTAAAT 

TAGCCAATTGGAATTAGTTTAGCCTGTGCGGTCTAACCCTAGCCAATAGGGGACTGACACAGCAGCAGGGGCCACATGTG 

TCAGGAATAAGACCCCCTTCCCCTCCCTGTCCAGATGTGTGCTCACCATTGCTCCATCTGTGAGGGCACACCCTTCTATA 

GAA GTAAATTGCCTTGCTGAGAAGAAAAAAAAGAACATTTTATATTCAAGTCCTATTTCTTTTC 

TTTATAACA 
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SEQUENZ PROTOKOLL 
<110> GSF - Forschungszentrura fur Umwelt und Gesundheit 



<120> Retrovirale Expressionsvektoren auf der Basis von 
HERV-LTR-Sequenzen . 



<130> P11045 



<140> DE 199 10 650,9 
<141> 1999-03-10 



<160> 47 



<170> Patentln Ver. 2.1 



<210> 1 

<211> 375 

<212> DNA 

<213> Human endogenous retrovirus 



<400> 1 

tgtcaggcct 

cagatagcct 

tgtttctgcc 

ctctttgtaa 

aagcattgcc 

ccacactttg 

ccatgttgct 



ctgagcccaa 
gaagcaactg 
ctaccctgac 
tcctccccac 
cctaactcca 
ctgactctct 
cacat 



gctaagccat 
taaaaatatc 
tgatcaatgt 
ccttgagaat 
ccgcctgtcc 
ttccagactc 



catatcccct 
cttaactgat 
gctttgtaat 
ggacttggtg 
caaaacctat 
agcccggctg 



gtgacctgca 
gacattccaa 
ctcccccacc 
agatccaccc 
gagaactaat 
cacccaggtg 



cgtatacatc 60 
tattgtgatt 120 
cttcagaagg 180 
cctgcctgca 240 
gataatccca 300 
aaataaacag 360 
375 



<210> 2 

<211> 400 

<212> DNA 

<213> Human endogenous retrovirus 



<400> 2 

tgtcaggcct 

cagatggcct 

attccaacat 

ccccaccctt 

tccacacctg 

aatcctataa 

gcctgcaccc 



ctgagcccaa 
aaagtaactg 
tgtgatttgt 
aagaaggtcc 
cccaccagag 
aacggcccca 
aggtgaaata 



gccaggccat 
aagatccaca 
tcctgcccca 
tttgtaattc 
aacaaacccc 
ccccatctcc 
aacagccatg 



cgcatcccct 
aaagaagtaa 
ccctaactga 
tccccaccct 
ctttgactgt 
ctttgctgac 
ttgctcacat 



gtgacttgca 
aaacagcctt 
taaatgtact 
tgagagtgta 
aattttccat 
tctcttttcg 



cgtatacatc 60 
aactgatgac 120 
ttgtaatctc 180 
ctttgtgaga 240 
taccttccct 300 
gactcagccc 360 
400 



<210> 3 

<211> 361 

<212> DNA 

<213> Human endogenous retrovirus 



<400> 3 

tgtcaggcct 

cagatggcct 

aactgatgac 

gcactgagca 

aattttcctt 

ctctcttttc 

t 



ctgagcccaa 
gaagtaactg 
attaccttgt 
ccttgtgacc 
tacctaccta 
ggactcagcc 



gctaagccat 
aagaatcaca 
gaaattcctt 
cctgcctctg 
aatcctataa 
cgcctgtacc 



catatcccct 
aaagaagtga 
ctcctggctc 
cccgccagag 
aatggcccca 
caggtgaaat 



gcgacctgca 
aaatggcctg 
atcctggctc 
agcaaccccc 
ctcctatctc 
aaacagccat 



catatacatc 
ttcctgcctt 
aaaagctccc 
tcttgactgt 
ccttcgctga 
gttgctcaca 



60 

120 

180 

240 

300 

360 

361 



<210> 4 
<211> 372 
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<212> DNA 

<213> Human endogenous retrovirus 



<400> 4 

tgtcaggcct 

cagatggccg 

tgttcgtgcc 

tcaaaagctc 

cctttgactg 

cccttggctg 

tgttgctcac 



ctgagcccaa 
gttcctgcct 
ttaactgatg 
cccgactgag 
taattttcct 
actctctttt 
at . 



gctaagccat 
taactgatga 
acattgtctt 
tacattgtga 
ttatctaccc 
cggactcagc 



catatcccct 
cattccacca 
gtgaaattcc 
cccccactcc 
aaatcctata 
ccgcctgcac 



gtgacctgca 
cgaaagaagt 
tcctcctggc 
tgcccgccag 
aaacagcccc 
ccaggtgaaa 



cgtacacatc 60 
gaaaatgacc 120 
tcatcctggc 180 
agaacagccc 24 0 
acctttatct 300 
taaacagcca 360 
372 



<210> 5 
<211> 349 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 5 

tgtcaggcct ctgagcccaa gccaagccat cgcatcccct gtgacttgca cgtgtatgcc 60 

cagatggcct gaagtaactg aagaatcaca aaagaagtga aaaggccctg ccccacctta 120 

actgagtgat taaccccatg aatttccttc ccctggctca gaagctcccc cactgagcac 180 

cttgtgaccc ctgcccctgc ccaccagaga acaaccccct ttgactgtaa ttttccatta 240 

ctttcccaaa tcctataaaa cggccccacc cctatctccc ttcgctgact ctcttttcgg 300 

actcagcccg cctgcaccca ggtgaaataa acagccatgt tgctcacat 349 



<210> 6 
<211> 324 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 6 

tgtcaggcct ctgagcccaa gcctgcacgt atacatccag atgaagcaag tgaagaatca 60 

caaaagaagt gaaaatggcc ggttcctgcc ttaactgatg acattacctt gtgaaattcc 120 

ttctcctggc tcagaagctc ccccactgag caccttgtga cccccactcc tccccgccac 180 

agaacaaccc cctttgactg taattttcca ctgcccgccc aaaccctata aaacggtccc 240 

accccatctc ccttccctga ctctcttttc ttcggactca gcccgcctgc acccaggtga 300 

aataaacagc catgttgctc acat 324 



<210> 7 
<211> 393 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 7 

tgtcaggcct ctgagcccaa gccaagccat cgcatcccct gtgacttgca cgtatacgcc 60 

cagatggcct gaagtaactg aagaatcaca aaagaactga aaaggccctg ccccgcctta 120 

actgatgaca ttccaccatg gtgatttgtt cttgccccac cttaactgag tgattaaccc 180 

tgtgaatttg cttctcctgg ctcagaagct cccccactga gcaccttgtg acccccgccc 240 

ctgcccacca gagaacaacc ccctttgact gtaattttcc attaccttcc caaatcctat 300 

aaaacggccc cacccctatc tcccttcgct gactctcttt tcggactcag cccgcctgcc 360 

cccaggtgaa ataaacagcc atgttgctca cat 393 



<210> 8 
<211> 393 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 8 

tgtcaggcct ctgagcccaa gccaagccat cgcatcccct gtgacttgca cgtatacgcc 60 
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cagatggcct gaagtaactg aagaatcaca aaagaactga aaaggccctg ccccgcctta 120 

actgatgaca ttccaccatg gtgatttgtt cttgccccac cttaactgag tgattaaccc 180 

tgtgaatttg cttctcctgg ctcagaagct cccccactga gcaccttgtg acccccgccc 240 

ctgcccacca gagaacagac ccctttgact gtaattttcc attaccttcc caaatcctat 300 

aaaacggccc cacccctatc tcccttcgct gactctcttt tcggactcag cccgcctgcc 360 

cccaggtgaa ataaacagcc atgttgctca cat 393 



<210> 9 

<211> 388 

<212> DNA 

<213> Human endogenous retrovirus 



<400> 9 

tgtcaggcct 

cagatggcct 

attccaccat 

tcccaccctt 

tccaccccct 

actaatgata 

gtgaaataaa 



ctgagcccaa 
gaagcaactg 
tgtgatttgt 
aagaaggttc 
gccggcaaaa 
atccaccacc 
cagccatgtt 



gctaagccat 
aagatccaca 
ttctgcccca 
tttgtaattc 
cattgctcct 
ctttgctgac 
gctcacat 



catatcccca 
aaggaagtga 
tcctaactga 
tccccaccct 
aacccaaccg 
tcttttcaga 



gggacctgca 
aaatagcctt 
tcaatgtact 
tgagagtgta 
cctaccccaa 
atcagcccgc 



cgtatacatc 60 
aactgatgac 120 
ttgtaatctc 180 
ctttgtgaga 240 
acctgtaaga 300 
ctgcacccag 360 
388 



<210> 10 

<211> 314 

<212> DNA 

<213> Human endogenous retrovirus 



<400> 10 

tgtcaggcct 

cagatgacct 

attccaccat 

cccttgagaa 

caccctttgc 

catgttgctc 



ctgagcccaa gctaagccat caaatcccct gtgacctgca cgtgtacatc 60 

gaagcaactg aagatccaca aaagaagtga aagtagcctt aactgatgac 120 

tgtgatttgt tcctgcccca cgctaactga taccatatat tcttcccccg 180 

tgtactttgt acacctatcc caaacctata agaactaatg ataatcctac 240 

tgactctctt tttggactca gcccgcctgc acccaggtga aataaacagc 300 
acat 314 



<210> 11 

<211> 309 

<212> DNA 

<213> Human endogenous retrovirus 



gacctgcata tacatccaga 60 
agccttaact gatgacattc 120 
atatattctt cccccgccct 180 
ctaatgataa tccaccaccc 240 
ggtgaaataa acagccatgt 300 

309 



<400> 11 

tgtcaggcct 

tggcctgaag 

caccattgtg 

tgagaatgta 

tttgctgact 

tgctcacat 



ctgagcccaa 
caactgaaga 
atttgttcct 
ctttgtacac 
ctctttttgg 



gctaagccat 
tccacaaagg 
gccccacgct 
ctatcccaaa 
actcagcccg 



catatcccgt 
aagtgaaaat 
aactgatacc 
cctataagaa 
cctgcaccca 



<210> 12 
<211> 314 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 12 

tgtcaggcct ctgagcccaa gctaagccat 
cagatgacct gaagcaactg aagatccaca 
attccaccat tgtgatttgt tcctgcccta 
cccttgagaa tgtactttgt acacctatcc 
caccctttgc tgactctctt tttggactca 
catgttgctc acat 



caaatcccct gtgacctaca cgtgtacatc 60 
aaagaagtga aagtagcctt aactgatgac 120 
cgctagctga taccatatat tcttcccccg 180 
caaacctata agaactaatg ataatcctac 240 
gcccgcctgc acccaggtga aataaacagc 300 

314 
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<210> 13 
<211> 341 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 13 

tgttgagatg 

ctaagcctag 

cacacccaac 

gaggtaaaga 

ggatataaac 

tatgggagct 



ggggactgag agacaggact agctggattt cctaggccga ctaagaatcc 60 

ctgggaaggt gaccgcatcc acctttaaac acggggctcg caacttagct 120 

caatcaggta gtaaagaggg ctcactaaaa tgctaattag gcaaagacag 180 

aatagccaat catctattgc ctgagagcac agcaggaggg acaatgatcg 240 

ccaagtcttc gagccggcaa tggctacctt ctttgggtcc cctccctttg 300 

ctgttttcac tctattaaat cttgcaactg c 341 



<210> 14 
<211> 341 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 14 

tgttgagatg 

ctaagcctag 

catatctgac 

gaggcaaaga 

ggatataaac 

tatgggagct 



ggggactgag 
ctgggaaggt 
caatcaggta 
agtagccaat 
ccaggcattc 
ctgtcttcac 



agacaggact 
gaccgcatcc 
gtaaagagag 
catctgttgc 
gagccagcta 
tctattaaat 



agctggattt 
atctttaaac 
ctcactaaaa 
ctgacagcac 
cagctaccct 
cttgcaactg 



cctaggccga 
atggggcttg 
tgctaattag 
agcaggaggg 
ctttgggtcc 



ctaagaattc 60 
caacttaact 120 
gctaaaacag 180 
acaatgatcg 240 
cctccctttg 300 
341 



<210> 15 
<211> 322 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 15 

tgttgagatg 

ctaagcctag 

cacacttgac 

gaggtaaaga 

gcatataaac 

ctctattaaa 



ggggactgag agacaggact acctggattt 
ctgggaaggt gaccacatcc acctttaaac 
cagtcaggta gtaaagagag ctcactaaaa 
aatagacaat catctatcac ctgagagcac 
ccaggcattc gagccagcaa cagcaacccc 
tcttgcaact gc 



cctaggccga ctaagaatcc 60 
acagggcttg caacttagct 120 
tgctaattag gctaaaacag 180 
agtgggaggg acaatgatcg 240 
ctttgggagc tctgttttca 300 

322 



<210> 16 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 16 

tgttgagatg 

ctaagcctag 

cacacccaac 

gaggtaaaga 

ggatataaac 

tatgggagct 



ggggactgag 
ctgggaaggt 
caatcaggta 
aatagccagt 
tcaggcattc 
ctgttttcac 



agacaggact 
gactacaccc 
gtaaagagag 
catctatcgc 
aagccagcaa 
tctattaaat 



agctggattt 
acctttaaac 
cttgctaaaa 
ctgacagcac 
tggctaccca 
cttgcaactg 



cctaggccaa ctaagaatcc 60 

atggggcttg caacttagct 120 

tgctaattag gcaaaaacag 180 

aaggggcggg acaatgatca 24 0 



ctttgggtcc cctcccattt 
caa 



300 
343 



<210> 17 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 
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<400> 17 

tgttgagatg 

ctaagcctag 

catacccaac 

gaggtaagga 

ggatataaac 

tatgggagct 



ggggactgag agacaggact agctggattc cctaggccga ctaagaatcc 60 

ctgggaaggt gaccacatcc acctttaaac acggggcttg caacttagct 120 

aaatcaggta gtaaagagag ctcactaaaa tactgattag gcgaaaacag 180 

aacagccagt catctatcgc ctgacagcac aaggggcggg acaatgatca 240 

tcaggcattc aagccagcaa tggctaccca ctttgggtcc cctcccattt 300 

ctgttttcac tctattaaat cttgcaactg caa 343 



<210> 18 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 18 

tgttgagatg ggggactgag agacaggact agttggattt cctaggctgg ctaagaatcc 60 
ctaagcctag ctgggaaatt gaccacgtcc acctttaaac acggggcttg caatttagct 120 
cacacccgac caatcaggta gtaaagggag ctcactaaaa tgctaattag ggaaaaacag 180 
gaggtaaaga agtagccaat catctatcgc ctgagagcac aacaggaggg acaatgatca 240 
ggatataaac ccaggcattc aagccagcgg tggctaccct ctttgggtcc cctccctttg 300 
tatgggagcc ctgttttcac tctattaaat cttgcaactg caa 343 



<210> 19 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 19 

tgttgagatg ggggactgag agacaggact agttggattt cctaggccgg ctaagaatcc 60 
ctaagcctag ctgggaaatt gaccacgtcc acctttaaac acggggcttg caatttagct 120 
cacacccgac caatcaggta gtaaagggag ctcactaaaa tgctaattag ggaaaaacag 180 
gaggtaaaga agtagccaat catcta'tcgc ctgagagcac aacaggaggg acaatgatca 240 
ggatataaac ccaggcattc aagccagcgg tggctaccct ctttgggtcc cctccctttg 300 
tatggaagct ctgttttcac tctattaaat cttgcaactg caa 343 



<210> 20 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 20 

tgttgagatg 

ctaagcctag 

cacacccgac 

gaggtagaga 

ggatataaac 

tatgggagct 



ggggactgag agacaggact agctggattt cctaggccaa ctaagaatcc 60 

ctgggaaggt gactacaccc acctttaacc actaggcttg caacttagct 120 

caatcaggta gtaaagagag cttgctaaaa tgctaattag gcaaaaacag 180 

aatagccaat catctatcgc ctgagagcac agcaggaggg acaatgatcc 240 

ccaagcattc gagccagcaa tggctaccct ctttgtgtcc cctccctttg 300 

ctattttcac tctattaaat cttgcaactg caa 343 



<210> 21 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 21 

tgttgagatg ggggactgag agacaggact agctggattt cctaggctga ctaagaatcc 60 
ctaagcctag ctgggaaggt gaccgcatcc atctttaaac atggggcttg caacttaact 120 
catatctgac caatcaggta gtaaagagag cttgctaaaa tgctaattag gcaaaaacag 180 
gaggtaaaga aatagccagt catctatcgc ctgacagcac aaggggcggg acaatgatca 240 
ggatataaac tcaggcattc aagccagcaa tggctaccca ctttgggtcc cctcccattt 300 
tatgggagct ctgttttcac tctattaaat cttgcaactg caa 343 
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<210> 22 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 22 

tgttgagatg 

ctaagcctag 

cacacccgac 

gaggtaaaga 

ggatataaac 

tatgggagct 



ggggactgag agacaggact agctggattt cctaggctga ctaagaatcc 60 

ctgggaaggt gactacaccc acctttaacc actaggcttg caacttagct 120 

caatcaggta gtaaagagag cttgctaaaa tgctaattag gcaaaaacag 180 

aatagccagt catctatcgc ctgacagcac aaggggcggg acaatgatca 240 

tcaggcattc aagccagcaa tggctaccca ctttgggtcc cctcccattt 300 

ctgttttcac tctattaaat cttgcaactg caa 343 



<210> 23 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 23 

tgttgagatg 

ctaagcctag 

cacacccgac 

gaggtaaaga 

ggatataaac 

tatggaagct 



ggggactgag 
ctgggaaatt 
caatcaggta 
agtagccaat 
ccaggcattc 
ctgttttcac 



agacaggact 
gaccacgtcc 
gtaaagggag 
catctatcgc 
aagccagcgg 
tctattaaat 



agttggattt 
acctttaaac 
ctcactaaaa 
ctgagagcac 
tggctaccct 
cttgcaactg 



cctaggctgg 
acggggcttg 
tgctaattag 
aacaggaggg 
ctttgggtcc 
caa 



ctaagaatcc 60 
caatttagct 120 
ggaaaaacag 180 
acaatgatca 240 
cctccctttg 300 
343 



<210> 24 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 24 

tgttgagatg 

ctaagcctag 

cacacccgac 

gaggtaaaga 

ggatataaac 

tatgggagct 



ggggactgag agacaggact acctggattt cctaggccaa ctaagaatct 60 

ctgggaaggt gaccacatcc acctttaaac acagggcttg caacttagct 120 

ccatcaggta agaaagagag cccgctaaaa tgctaattag gcaaaaacag 180 

aatagtcaat catctattgc ctgagagcac agcgggaggg acaatgatca 240 

ccaggcattc gagccggcaa cgactaccct ctttgggtcc cctccctttg 300 

ctgttttcac tctattaaat cttgcaactg caa 343 



<210> 25 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 25 

tgttgagatg 

ctaagcctag 

cacacccgac 

gaggtaaaga 

ggatataaac 

tatgggagct 



ggggactgag agacaggact agctggattt cctaggccaa ctaagaatcc 60 

ctgggaaggt gactacaccc acctttaacc actaggcttg caacttagct 120 

caatcaggta gtaaagagag cttgctaaaa tgctaattag gcaaaaacag 180 

aatagccagt catctatcgc ctgacagcac aaggggcggg acaatgatca 240 

tcaggcattc aagccagcaa tggctaccca ctttgggtcc cctcccattt 300 

ctgttttcac tctattaaat cttgcaactg caa 343 



<210> 26 
<211> 343 
<212> DNA 

<213> Human endogenous retrovirus 



WO 00/53789 



PCI7EPO0/02064 



<400> 26 

tgttgagatg 

ctaagcctag 

cacacccgac 

gaggtaaaga 

ggatataaac 

tatgggagct 



ggggactgag aaacaggact agcaggattt cctaggccga ttaagaatcc 60 

atgggaagtt gaccacatcc acctttaaac acggggcttg caactcagct 120 

ccatcaggta agaaagagag cccgctaaaa tgctaattag gcaaaaacag 180 

aatagccaat catctattgc ctgagagcac agcgggaggg acaatgatca 24 0 

ccaggcattc gagccggcaa cgactaccct ctttgggtcc cctccctttg 300 

ctgttttcac tctattaaat cttgcaactg caa 343 



<210> 27 
<211> 619 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 27 

gcgaccggtg 

cgggttttat 

ttgtctcaac 

ttacgggtgt 

actatcacat 

gccttccgca 

gagcatgctg 

tcaaccctga 

gattaacaga 

atgtctactt 

tttccccctt 



gatcccgggc 
accgagacat 
tgcaagaggc 
cgggctgggg 
ggggagaaac 
gtttttgtgt 
ccttcaagca 
gttgacacag 
atctcaaggc 
ctttctacac 
ttcttttcg 



ccgcggtacc 
tccattgccc 
attccttcct 
gacggtcagg 
cttggacaat 
cctgggtact 
tctgtttaac 
cacacgtttc 
agaagaattt 
agacacagta 



gtcgactgca 
agggacaggc 
cttatactaa 
tctttccctt 
acctggcttt 
tgagattagg 
aaagcacatc 
agagagcacg 
ttcttaacac 
acaatctgat 



gaattcatgg 
aggagacaga 
tcctcctcag 
cccacgaggc 
cctaggcaga 
gagtggtgat 
ctgcaccgcc 
gggttggggg 
ataacaaaat 
ctctcttgct 



agcatacaat 
tgccttcctc 
cacagaccct 
catatttcag 
ggtccctgcg 
gactcttaag 
cttaatccat 
taaggtcata 
ggagtctccc 
tttccccaca 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

619 



<210> 28 
<211> 620 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 28 

gcgaccggtg 

cgggttttat 

ttgtctcaac 

ttacgggtgt 

actatcacat 

gccttccgca 

gagcatgctg 

tcaaccctga 

gattaacaga 

atgtctactt 

tttccccctt 



gatcccgggc 
accgagacat 
tgcaagaggc 
cgggctgggg 
ggggagaaac 
gtttttgtgt 
ccttcaagca 
gttgacacag 
atctcaaggc 
ctttctacac 
ttcttttcga 



ccgcggtacc 
tccattgccc 
attccttcct 
gacggtcagg 
cttggacaat 
cctgggtact 
tctgtttaac 
cacacgtttc 
agaagaattt 
agacacagta 



gtcgactgca 
agggacaggc 
cttatactaa 
tctttccctt 
acctggcttt 
tgagattagg 
aaagcacatc 
agagagcacg 
ttcttaacac 
acaatctgat 



gaattcatgg 
aggagacaga 
tcctcctcag 
cccacgaggc 
cctaggcaga 
gagtggtgat 
ctgcaccgcc 
gggttggggg 
ataacaaaat 
ctctcttgct 



agcatacaat 
tgccttcctc 
cacagaccct 
catatttcag 
ggtccctgcg 
gactcttaag 
cttaatccat 
taaggtcata 
ggagtctccc 
tttccccaca 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

620 



<210> 29 
<211> 624 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 29 

gcgaccggtg 

cgggttttat 

ttgtctcaac 

ttacgggtgt 

actatcacat 

gccttccgca 

gagcatgctg 

tcaaccctga 

gattaacaga 

atgtctactt 



gatcccgggc 
accgagacat 
tgcaagaggc 
cgggctgggg 
gggaagaaac 
gtttttgtgt 
ccttcaagca 
gttgacacag 
atctcaaggc 
ctttctacac 



ccgcggtacc 
tccattgccc 
attccttcct 
gatggtcagg 
cttggacaat 
cctgggtact 
tctgtttaac 
cgcacgtttc 
agaagaattt 
agacacagta 



gtcgactgca 
agggacaggc 
cttatactaa 
tctttccctt 
acctggcttt 
tgagattagg 
aaagcacatc 
agagagcacg 
ttcttaacac 
acaatctgat 



gaattcatgg 
aggagacaga 
tcctcctcag 
cccacgaggc 
cctaggcaga 
gagtggtgat 
ctgcactgcc 
gggttggggg 
ataacaaaat 
ctctcttgct 



agcatacaat 
tgccttcctc 
cacagaccct 
catatttcag 
ggtccctgcg 
gactcttaag 
cttaatccat 
taaggtcata 
ggagtctccc 
tttccccaca 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 



* • 
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tttccccctt ttcttttcga caaa 62 4 



<210> 30 

<211> 646 

<212> DNA 

<213> Human endogenous retrovirus 



<400> 30 

gcgaccggtg 

cgggttttat 

ttgtctcaac 

ttacgggtgt 

actatcacat 

gccttccgca 

gagcatgctg 

tcaaccctga 

gattaacaga 

atgtctactt 

tttccccctt 



gatcccgggc 
accgagacat 
tgcaagaggc 
cgggctgggg 
ggggagaaac 
gtttttgtgt 
ccttcaagca 
gttgacacag 
atctcaaggc 
ctttctacac 
ttcttttcga 



ccgcggtacc 
tccattgccc 
attccttcct 
gacggtcagg 
cttggacaat 
cctgggtact 
tctgtttaac 
cacacgtttc 
agaagaattt 
agacacagta 
caaaaccgcc 



gtcgactgca 
agggacaggc 
cttatactaa 
tctttccctt 
acctggcttt 
tgagattagg 
aaagcacatc 
agagagcacg 
ttcttaacac 
acaatctgat 
atctcgagat 



gaattcatgg 
aggagacaga 
tcctcctcag 
cccacgaggc 
cctaggcaga 
gagtggtgat 
ctgcaccgcc 
gggttggggg 
ataacaaaat 
ctctcttgct 
ctgagt 



agcatacaat 
tgccttcctc 
cacagaccct 
catatttcag 
ggtccctgcg 
gactcttaag 
cttaatccat 
taaggtcata 
ggagtctccc 
tttccccaca 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

646 



<210> 31 

<211> 672 

<212> DNA 

<213> Human endogenous retrovirus 



<400> 31 

gtcccacctc 

gttttatacc 

tctcaactgc 

cgggtgtcgg 

atcacatggg 

ttccgcagtt 

catgctgcct 

accctgagtt 

taacagaatc 

tctacttctt 

cccccttttc 

cgccctatag 



cagccctaag 
gagacattcc 
aagaggcatt 
gctgggggac 
gagaaacctt 
tttgtgtcct 
tcaagcatct 
gacacagcac 
tcaaggcaga 
tctacacaga 
ttatccatca 
tg 



gcggtttttc 
attgcccagg 
ccttcctctt 
ggtcaggtct 
ggacaatacc 
gggtacttga 
gtttaacaag 
acgtttcaga 
agaatttttc 
cacagtaaca 
cactggcggc 



cctatctcag 
gacaggcagg 
atactaatcc 
ttcccttccc 
tggctttcct 
gattagggag 
gcacatcctg 
gagcacgggg 
ttaacacata 
atctgatccc 
cgctcgagca 



tagatggagc 
agacagatgc 
tcctcagcac 
acgaggccat 
aggcagaggt 
tggtgatgac 
caccgccctt 
ttgggggtaa 
acaaaatgga 
tcttgctttt 
tgcatctaga 



atacaatcgg 
cttcctcttg 
agacccttta 
atttcagact 
ccctgcggcc 
tcttaaggag 
aatccattca 
ggtcatagat 
gtctcccatg 
ccccacattt 
gggcccaatt 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

672 



<210> 32 

<211> 593 

<212> DNA 

<213> Human endogenous retrovirus 



<400> 32 

agtagatgga 

ggagacagat 

cctcctcagc 

ccacgaggcc 

ctaggcagag 

gagtggtgat 

ctgcaccgcc 

gggttggggg 

ataacaaaat 

ctctcttgct 



gcatacaatc 
gccttcctct 
acagaccctt 
atatttcaga 
gtccctgcgg 
gactcttaag 
cttaatccat 
taaggtcata 
ggagtctcct 
tttccccaca 



gggttttata 
tgtctcaact 
tacaggtgtc 
ctatcacatg 
ccttctgcag 
gagcatgctg 
tcaaccctga 
gattaacaga 
atgtctactt 
tttccccctt 



ccgagacatt 
gcaagaggca 
gggctggggg 
gggagaaacc 
tttttgtgtc 
ccttcaagca 
gttgacacag 
atctcaaggc 
ctttctacac 
ttcttttcga 



ccattgccca 
ttccttcctc 
acggtcaggt 
ttggacaata 
cctgggtact 
tctgtttaac 
cacatgtttc 
agaagaattt 
agacacagta 
caaaaccgcc 



gggacaggca 
ttttactaat 
ctttcccttc 
cctggctttc 
tgagattagg 
aaagcacatc 
agagagcacg 
ttcttagcac 
acaatttgat 
ate 



60 

120 

180 

240 

300 

360 

420 

480 

540 

593 



<210> 33 
<211> 943 
<212> DNA 



WO 00/53789 



PCT/EP00/02064 



<213> Human endogenous retrovirus 



<400> 33 

tgtgggcgaa 

ataatataga 

catggacatt 

ttgttttatt 

acattgtgag 

cagcttgagg 

gcagaccatg 

agcttcttgt 

tgctgtgctt 

cctctttgaa 

tataagtgca 

taaaaggaaa 

gaggactcac 

agccattcgg 

tgttttctct 

catggggaga 



ggattaccca 
aaatagctag 
accaatcatt 
actaatataa 
aagtgaccta 
gctccttggt 
aaagggagtc 
gtatccagcc 
caatggccat 
gttcgtagaa 
tagaagaaaa 
ggcccccttt 
cctccttacc 
ggccactact 
ttatctcttt 
acaccggcaa 



ggtgccgagg 
aataagaata 
actacaaaca 
ccaaggaata 
gaaggcaaga 
caagctgtaa 
tccattcctt 
ctgcccacag 
gcttcttgtc 
gataatggta 
cactgatgta 
cccatgatca 
ctgtcccttt 
ggtctccgca 
tgtcttgtgt 
agcccgtagg 



caagagactg 
gttataataa 
ttgttaatca 
accggtagca 
ggtgagcctt 
caccagtgcc 
ggaggagtca 
tcatccagag 
cactttcatg 
gaagaaatag 
tgcctgcctt 
catgacttgc 
gtcttgtatg 
acttggtggt 
ctttatttct 
gctggacctt 



aaggcacaaa 
aaattagata 
ttagctttta 
tacggtcagg 
ctgtcacgcc 
tgggaaggca 
gggaaacact 
gcataaaccc 
ttcctcctgt 
tgaaagtctt 
ccctctctgc 
ctgaccttat 
caataaatat 
agtggtaccc 
tacaatctct 
aca 



ctgtttcagt 
tacacatgat 
atattactct 
tgctgaaggg 
tgcataagga 
ccgttactta 
atgctccacc 
ctccctgtgg 
actcctggtt 
tgatctttct 
ttcagctacc 
caatcacttg 
cagcacgccc 
tgggcccagc 
catctctgca 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

943 



<210> 34 
<211> 389 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 34 

aaacccctcc 

tcctgtactc 

agtctttgat 

ctctgcttca 

ccttatcaat 

aaatatcagc 

gtaccctggg 



ctgtggtgct 
ctggttcctc 
ctttcttata 
gctacctaaa 
cacttggagg 
acgcccagcc 
cccagctgtt 



gtgcttcaat 
tttgaagttc 
agtgcataga 
aggaaaggcc 
actcaccctc 
attcggggcc 
ttctcttta 



ggccatgctt 
gtagaagata 
agaaaacact 
ccctttccca 
cttaccctgt 
actactggtc 



cttgtccact 
atggtagaag 
gatgtatgcc 
tgatcacatg 
ccctttgtct 
tccgcaactt 



ttcatgttcc 60 
aaatagtgaa 120 
tgccttccct 180 
acttgcctga 240 
tgtatgcaat 300 
ggtggtagtg 360 
389 



<210> 35 

<211> 858 

<212> DNA 

<213> Human endogenous retrovirus 



<400> 35 

tgtgggcgga 

ataataaaga 

aacaattatc 

gcattaataa 

tgtgagaagt 

tgagggcccc 

accgggaaag 

cttgtgggag 

ccctgtggtg 

gttcctcttt 

ttgatcttat 

gctacctaag 

tcacttagaa 

cgagcccagc 

cccagctgtt 



agagtaccta 
aaatagaata 
catcattatt 
tataacctag 
gaatagaagg 
ttggtcaagc 
ggagtctcct 
gctggatgtt 
cttcaatggt 
gaagttcgta 
aagttcatag 
agggaagggc 
gactgaccct 
cgttcagggc 
ttctcttt 



ggtgccgagg 
agaatagtca 
ataaacatta 
gaataaccgg 
caagagggga 
ggtaacgcca 
ttccttggag 
acccaggcct 
cacgttcctt 
gtagatagcg 
aagaaaacgc 
ccgctgtcct 
ccttatcctg 
cactaccggt 



caagagactg 
taatacaaat 
ttaatcatta 
caggtatagg 
gccttctgtc 
gtgtctggga 
gagtcaggga 
gcctgcagtc 
gtccactttc 
gtagaagaaa 
tgatgcctgc 
gtgatcaggt 
cccccttgtc 
ctccgtgtct 



aaggcacaaa 
tagatacagc 
gcttttaata 
gtcaggtgct 
atgcccgcat 
aggcacccgt 
acgctctgct 
atccggaggc 
atgctccttc 
tagtgaaagt 
cgccttctct 
gacttgcttc 
ttgtatgcaa 
ttgtggtagt 



ctgtttcagt 
gatgatcatg 
ttactctgtt 
gaagggacat 
aagggccgct 
tactgagcag 
ccaccagctt 
ctgaacccct 
cgtactcctg 
cttaaagtct 
ctctgcttca 
accttgtcaa 
taaatatcag 
ggtccccggg 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

858 



<210> 36 

<211> 386 

<212> DNA 

<213> Human endogenous retrovirus 



WO 00/53789 PCT/EP00/02064 



<400> 36 

gaacccctcc 

tactcctggt 

taaagtcttt 

ctgcttcagc 

cttgtcaatc 

aatatcagcg 

tccccgggcc 



ctgtggtgct 
tcctctttga 
gatcttataa 
tacctaagag 
acttagaaga 
agcccagccg 
cagctgtttt 



tcaatggtca 
agttcgtagt 
gttcatagaa 
ggaagggccc 
ctgaccctcc 
ttcagggcca 
ctcttt 



10 

cgttccttgt 
agatagcggt 
gaaaacgctg 
gctgtcctgt 
ttatcctgcc 
ctaccggtct 



ccactttcat 
agaagaaata 
atgcctgccg 
gatcaggtga 
cccttgtctt 
ccgtgtcttt 



gctccttccg 60 
gtgaaagtct 120 
ccttctctct 180 
cttgcttcac 240 
gtatgcaata 300 
gtggtagtgg 360 
386 



<210> 37 
<211> 844 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 37 

tgtgggtgga 

ataataaaaa 

gacaattagc 

tataacctag 

gacctggaag 

cttggtcaag 

gggagtctcc 

ggctggatat 

gctgtgcttc 

ctctttgaag 

tctttcttac 

gctacctaaa 

tcacttagaa 

tgaccccagc 

gccc 



ggattaccca 
aaatagaata 
aatcactatt 
gaataaccgg 
gcaagaggtg 
tggtaacgcc 
tttccttgga 
tatccaggcc 
aatggtccca 
agcgcagtag 
aagtgcagag 
agggaagggc 
gattcactct 
cgttcagggc 



ggtgccaagg 
agaatagtca 
aatctttagc 
tgggtatagg 
agccctctgt 
agtgtctggg 
agagttgggg 
tgcgcgcagt 
ctccttgt.cc 
atagcggtag 
aagaaaacgc 
cgcctatcct 
ccttaccctg 
cactactggt 



caagagactg 
taatacaaat 
ttttaatatt 
gtcaggtgct 
cacgcccaca 
aatgcacccg 
aacactctgc 
catccggagg 
actttcatgc 
aagaaatagt 
tgacatatgc 
gtaatcacat 
cccccttgtc 
ctccgcgtct 



aaggcacaaa 
tagatataga 
actctttgtt 
gaagggacat 
taagggccgc 
ttaattagca 
tccaccagct 
cttaaaccct 
tcctcccgta 
gaaagtctta 
tgccttccct 
gacttgcttc 
ttgtatgcaa 
tgatggtagt 



ctgtttcagt 60 
gatgatcatg 120 
gcattactaa 180 
tgtgtgaagt 240 
ttgagggctc 300 
gaccgcgaaa 360 
tcttgtggaa 420 
tccctgtggt 480 
ctcctggttc 540 
aagtcttcga 600 
ctctgcttcg 660 
accttgtcaa 720 
taaatatcag 780 
ggtcaccccg 840 
844 



<210> 38 
<211> 381 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 38 

aaacccttcc 

tcccgtactc 

agtcttaaag 

cttccctctc 

ttgcttcacc 

tatgcaataa 

tggtagtggt 



ctgtggtgct 
ctggttcctc 
tcttcgatct 
tgcttcggct 
ttgtcaatca 
atatcagtga 
caccccggcc 



gtgcttcaat 
tttgaagagc 
ttcttacaag 
acctaaaagg 
cttagaagat 
ccccagccgt 
c 



ggtcccactc 
gcagtagata 
tgcagagaag 
gaagggccgc 
tcactctcct 
tcagggccac 



cttgtccact 
gcggtagaag 
aaaacgctga 
ctatcctgta 
taccctgccc 
tactggtctc 



ttcatgctcc 60 
aaatagtgaa 120 
catatgctgc 180 
atcacatgac 240 
ccttgtcttg 300 
cgcgtcttga 360 
381 



<210> 39 
<211> 859 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 39 

tgtgggtgga 

ataataaaaa 

gacaattagc 

tataacctag 

gacctggaag 

cttggtcaag 

gggagtctcc 

ggctggatat 



ggattaccca 
aaatagaata 
aatcactatt 
gaataaccgg 
gcaagaggtg 
tggtaacgcc 
tttccttgga 
tatccaggcc 



ggtgccaagg 
agaatagtca 
aatctttagc 
tgggtatagg 
agccctctgt 
agtgtctggg 
agagttgggg 
tgcgcgcagt 



caagagactg 
taatacaaat 
ttttaatatt 
gtcaggtgct 
cacgcccaca 
aatgcacccg 
aacactctgc 
catccggagg 



aaggcacaaa 
tagatataga 
actctttgtt 
gaagggacat 
taagggccgc 
ttaattagca 
tccaccagct 
cttaaaccct 



ctgtttcagt 60 
gatgatcatg 120 
gcattactaa 180 
tgtgagaagt 240 
ttgagggctc 300 
gaccgcgaaa 360 
tcttgtggaa 420 
tccctgtggt 480 
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+ 
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gctgtgcttc 
ctctttgaag 
tctttcttac 
gctacctaaa 
tcacttagaa 
tgaccccagc 
gcccaggtgt 



aatggtccca 
agcgcagtag 
aagtgcagag 
agggaagggc 
gattcaccct 
cgttcagggc 
tttttcttt 



ctccttgtcc 
atagcggtag 
aagaaaacgc 
cgcctatcct 
ccttaccctg 
cactactggt 



1 1 

actttcatgc 
aagaaatagt 
tgacatatgc 
gtaatcacat 
cccccttgtc 
ctccgcgtct 



tcctcccgta 
gaaagtctta 
tgccttccct 
gacttgcttc 
ttgtatgcaa 
tgatggtagt 



ctcctggttc 540 
aagtcttcga 600 
ctctgcttcg 660 
accttgtcaa 720 
taaatatcag 780 
ggtcaccccg 840 
859 



<210> 40 
<211> 396 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 40 

aaacccttcc 

tcccgtactc 

agtcttaaag 

cttccctctc 

ttgcttcacc 

tatgcaataa 

tggtagtggt 



ctgtggtgct 
ctggttcctc 
tcttcgatct 
tgcttcggct 
ttgtcaatca 
atatcagtga 
caccccggcc 



gtgcttcaat 
tttgaagagc 
ttcttacaag 
acctaaaagg 
cttagaagat 
ccccagccgt 
caggtgtttt 



ggtcccactc 
gcagtagata 
tgcagagaag 
gaagggccgc 
tcaccctcct 
tcagggccac 
ttcttt 



cttgtccact 
gcggtagaag 
aaaacgctga 
ctatcctgta 
taccctgccc 
tactggtctc 



ttcatgctcc 60 
aaatagtgaa 120 
catatgctgc 180 
atcacatgac 240 
ccttgtcttg 300 
cgcgtcttga 360 
396 



<210> 41 
<211> 966 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 41 

tgtgggtgga 

ataataaaga 

catggacaat 

tttgttgcat 

ggacattggg 

ggttgcttga 

ttagccgacc 

ccagcttctt 

aacccctccc 

cccatactcc 

atcttaaagt 

ttctctgtct 

tgcttcacct 

atgcaataaa 

tggtagtggt 

attacaatct 

cctaca 



ggattaccca 
aaatggttag 
tatcaatcat 
tactaatata 
agaagtgacc 
gggctccttg 
acgaaaggga 
gtggaaggct 
tgtggtgctg 
tggtttctct 
gtttgatctt 
gcttcagcta 
tgtcaatcac 
tatcagtgca 
cccccgggcc 
ctcgtctccg 



ggtgccgagg 
aataagaata 
tattataaac 
acctaggaat 
tagaaggcaa 
gtcaagtggt 
gtctcctttc 
ggatattatc 
tgcttcaatg 
ttgaagttcg 
tcttataagt 
cctaagaggg 
ttagaagatt 
cccagccttt 
cagctgtttt 
cacacaggga 



caagagactg 
gtcataatac 
attattaatc 
aaccggtggg 
gaggtgagtc 
aacgccggtg 
cttggaggag 
caggcctgcc 
ggcacactcc 
tagtagatag 
gcatagaaga 
aagggccccc 
caccctcctt 
cggggccact 
ctctttatct 
gaacacccgc 



aaggcacaaa 
aaattagata 
attagctttt 
tatagggtca 
ttctgtcacg 
tctgggaagg 
tcagggcgca 
cgcagtcatc 
tcgtccactt 
tggtagaagg 
aaacgctgac 
tgtccagtga 
accctgcccc 
taccggtctc 
ctttgtcttg 
taagctccgt 



ctgtttcagt 60 
tagagatgat 120 
aatattactc 180 
ggtgctgaaa 240 
cccgcataag 300 
cacctgttac 360 
ctctgctcca 420 
cggaggccta 48 0 
tcatgttcct 540 
aatagggaaa 600 
atatgctgcc 660 
tcacgtgact 720 
cttgtcttgt 780 
cacgtcttgg 840 
tgtcttattt 900 
agggctggac 960 
966 



<210> 42 
<211> 398 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 42 

aaacccctcc 

tcccatactc 

aatcttaaag 

cttctctgtc 

ttgcttcacc 

tatgcaataa 

gtggtagtgg 



ctgtggtgct 
ctggtttctc 
tgtttgatct 
tgcttcagct 
ttgtcaatca 
atatcagtgc 
tcccccgggc 



gtgcttcaat 
tttgaagttc 
ttcttataag 
acctaagagg 
cttagaagat 
acccagcctt 
ccagctgttt 



gggcacactc 
gtagtagata 
tgcatagaag 
gaagggcccc 
tcaccctcct 
tcggggccac 
tctcttta 



ctcgtccact 
gtggtagaag 
aaaacgctga 
ctgtccagtg 
taccctgccc 
ttaccggtct 



ttcatgttcc 60 
gaatagggaa 120 
catatgctgc 180 
atcacgtgac 240 
ccttgtcttg 300 
ccacgtcttg 360 
398 
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<210> 43 
<211> 938 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 43 

tgtgggtgga 

ataataaaga 

catggacaat 

tttgttgcat 

ggacattggg 

ggttgcttga 

ttagccgacc 

ccagcttctt 

aacccctccc 

cccatactcc 

atcttaaagt 

ttctctgtct 

tgcttcacct 

atgcaataaa 

ggtagtggtc 

tacaatctct 



ggattaccca 
aaatggttag 
tatcaatcat 
tactaatata 
agaagtgacc 
gggctccttg 
acgaaaggga 
gtggaaggct 
tgtggtgctg 
tggttcctct 
gtttgatctt 
gcttcagcta 
tgtcaatcac 
tatcagtgca 
ccccggccca 
cgtctccgca 



ggtgccgagg 
aataagaata 
tattataaac 
acctaggaat 
tagaaggcaa 
gtcaagtggt 
gtctcctttc 
ggatattatc 
tgcttcaatg 
ttgaagttcg 
tcttataagt 
cctaagaggg 
ttagaagatt 
cccagccttt 
gctgttttct 
cacagggaga 



caagagactg 
gtcataatac 
attattaatc 
aaccggtggg 
gaggtgagtc 
aacgccggtg 
cttggaggag 
caggcctgcc 
ggcacactcc 
tagtagatag 
gcatagaaga 
aagggccccc 
caccctcctt 
cggkkcactt 
ctttatctct 
acacccgc 



aaggcacaaa 
aaattagata 
attagctttt 
tatagggtca 
ttctgtcacg 
tctgggaagg 
tcagggcaca 
cgcagtcatc 
tcgtccactt 
tggtagaagg 
aaacgctgac 
tgtccagtga 
accctgcccc 
accggtctcc 
ttgtcttgtg 



ctgtttcagt 60 
tagagatgat 120 
aatattactc 180 
ggtgctgaag 240 
cccgcataag 300 
cacctgttac 360 
ctctgctcca 420 
cggaggccta 4 80 
tcatgttcct 540 
aatagggaaa 600 
atatgctgcc 660 
tcacgtgact 720 
cttgtcttgt 780 
acgtcttggt 84 0 
tcttatttat 900 
938 



<210> 44 
<211> 396 
<212> DNA 

<213> Human endogenous retrovirus 
<400> 44 

aaacccctcc ctgtggtgct gtgcttcaat gggcacactc ctcgtccact ttcatgttcc 60 
tcccatactc ctggttcctc tttgaagttc gtagtagata gtggtagaag gaatagggaa 120 
aatcttaaag tgtttgatct ttcttataag tgcatagaag aaaacgctga catatgctgc 180 
cttctctgtc tgcttcagct acctaagagg gaagggcccc ctgtccagtg atcacgtgac 240 
ttgcttcacc ttgtcaatca cttagaagat tcaccctcct taccctgccc ccttgtcttg 300 
tatgcaataa atatcagtgc acccagcctt tcggkkcact taccggtctc cacgtcttgg 360 
tggtagtggt cccccggccc agctgttttc tcttta 396 



<210> 45 
<211> 963 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 45 

tgtgggcgaa 

ataataaaga 

catggacaat 

gttgctttac 

tattgtgaga 

cgcttgaggg 

gcagaccgcg 

gcttcttgtg 

ccctccctgt 

gtactcctgg 

ttaaagtatt 

tctatctctg 

gcttcacctt 

caataaatat 

agtggtcccc 

acaatctctt 

aca 



agattaccta 
aaatagttaa 
tatcaatcat 
taatataacc 
agtgacctag 
ctctttggtc 
aaagggagtc 
gaaggctgga 
ggtgctgtgc 
ttcctctttg 
tgatctttct 
cggtggctac 
atcacttaga 
cagcacgccc 
cgggcccagc 
gtctctgcac 



ggtgccgagg 
aataagaata 
tattataaac 
taggaataac 
aaggcaagag 
aagtggtaac 
tcctttcctt 
tattatctag 
ttcagtggtc 
aagttcgtag 
tataagtgca 
ctaaaaggga 
agattcatcc 
agtcgtttga 
tattgtctct 
acagggagaa 



caagagactg 
gttataatac 
attaatcatt 
cggtgggtat 
gtgagccttc 
gccagtgtct 
ggaggagtca 
gcctgcccgc 
actctccttg 
tagatagcag 
tagaagaaaa 
agggccccct 
tccttaccct 
ggccactgcc 
ttatctcttt 
cacctgctaa 



aaggcacaaa 
aaattagata 
agcttttaat 
agggtcaggt 
tgtcacgccc 
gtgaaggcac 
gggaacactc 
agtcatctgg 
tccactttca 
tagaagaaat 
cgctgacata 
gtcccatgat 
gcgccccctc 
ggtctccgcg 
gtcttgtgtc 
gccccgtagg 



ctgtttcagt 
tagagatgat 
attactcttt 
gttgacggga 
acataagggc 
ctgttactta 
tgctccacca 
aggcctaaac 
tgttcctccc 
agtgaaagtc 
tgctgccttc 
catgtgactt 
gtcttgtatg 
tcttggtggt 
tttatttatt 
actggaccct 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

963 
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<210> 46 
<211> 397 
<212> DNA 

<213> Human endogenous retrovirus 



<400> 46 

aaacccctcc 

tcccgtactc 

agtcttaaag 

cttctctatc 

acttgcttca 

tatgcaataa 

tggtagtggt 



ctgtggtgct 
ctggttcctc 
tatttgatct 
tctgcggtgg 
ccttatcact 
atatcagcac 
cccccgggcc 



gtgcttcagt 
tttgaagttc 
ttcttataag 
ctacctaaaa 
tagaagattc 
gcccagtcgt 
cagctattgt 



ggtcactctc 
gtagtagata 
tgcatagaag 
gggaagggcc 
atcctcctta 
ttgaggccac 
ctcttta 



cttgtccact 
gcagtagaag 
aaaacgctga 
ccctgtccca 
ccctgcgccc 
tgccggtctc 



ttcatgttcc 60 

aaatagtgaa 120 

catatgctgc 180 

tgatcatgtg 240 

cctcgtcttg 300 

cgcgtcttgg 360 
397 



<210> 47 
<211> 489 
<212> DNA 
<213> Human 



endogenous 



retrovirus 



<400> 47 

tgttcaattc tttgccttct acttttaaac 
tcacctgctc cactctgact cattctgatc 
ctgatccact gtgactcatt ccgattaccc 
tcctgctctg ccataaccat ttttcccgcc 
tagccaattg gaattagttt agcctgtgcg 
agcagcaggg gccacatgtg tcaggaataa 
get caeca tt gctccatctg tgagggcaca 
gaagaaaaaa aagaacattt tatattcaag 
tttataaca 



ttaacttcct cataaagcaa cctttttcaa 60 

acctgctcca ccctgactca ttccgatcac 120 

gctccaccct gactcattct gattctgatt 180 

aaaccactca ccctgtcact ctctttaaat 240 

gtctaaccct agecaatagg ggactgacac 300 

gacccccttc ccctccctgt ccagatgtgt 360 

cccttctata gaagtaaatt gecttgetga 420 

tcctatttct tttgetgeae cgaaacttta 480 

489 
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= (54) Title: RETROVIRAL EXPRESSION VECTORS ON THE BASIS OF HERV- LONG TERMINAL REPEAT SEQUENCES 

gg (54) Bezeichnung: RETROVIRALE EXPRESSIONSVEKTOREN AUF DER BASIS VON HERV-LTR-SEQUENZEN 

(57) Abstract: The invention relates to retroviral expression vectors with cell-specifically modulatable promotors. The vectors can 
be used, for example, for the cell-specific expression of therapeutically valuable genes in gene therapy. The invention specifically 
relates to retroviral expression vectors containing at least the following elements, in a functional configuration: a) DNA sequences 
for the packaging of the vector RNA and for the cell-specific expression of proteins or peptides which are coded by heterologous 
DNA nucleotide sequences; b) one or more DNA nucleotide sequences coding for a protein or a peptide and characterized in that 
for cell-specific expression said DNA sequences contain a cell-specifically modulatable promotor region of a human endogenous 
retroviral DNA nucleotide sequence (HERV). 

(57) Zusanimenfassung: Die vorliegende Erfindung betrifft retrovirale Expressionsvektoren mit zellspezifisch regulierbaren Pro- 
motoren. Die Vektoren sind beispielsweise zur zellspezifischen Expression therapeutisch wertvoller Gene im Rahmen einer Gen- 
therapie einsetzbar. Die Erfindung beschreibt retrovirale Expressionsvektoren, enthaltend zumindest die nachfolgenden Elemente 
in funktioneller Anordnung: a) DNA-Sequenzen zur Verpackung der Vektor-RNA und zur zellspezifischen Expression von Protei- 
nen oder Peptiden, die von heterologen DNA-Nukleotidsequenzen kodiert werden; b) eine oder mehrere fiir ein Protein Oder Peptid 
kodierende DNA-Nukleotidsequenzen, dadurch gekennzeichnet, dafi die DNA-Sequenzen zur zellspezifischen Expression eine zeil- 
»^ spezifisch regulierbare Promotorregion aus einer humanen endogenen retroviralen DNA-Nukleotidsequenz (HERV) enthalten. 



